통계이야기 1
  통계이야기 2
  통계이야기 3
  통계이야기 4
  통계이야기 5
 
[데이타 마이닝]숨겨진 광맥을 찾아라
[데이타 마이닝]:숨겨진 광맥을 찾아라

데이터 마이닝이란 특별한 학문 분야가 아니고 통계 분석의 환경 변화에 대응하여
IT 산업계의 마케팅 전략에서 나온, 수요 창출용 용어로 볼 수 있습니다.



기존의 통계 분석이 실험,설문지등 소규모의 데이터를 사용하여 학계나 연구소의 연구 목적을 위하는 것이
대부분이였는데 정보 통신의 발달로 인하여 기업, 정부나 정부 산하 기관의 데이터 베이스에 대규모의
데이터가 축적됨에 따라 이 데이터를 분석하고 싶은 유혹이 생겼습니다. 이에 따라 기존에 잘 사용되지
않았든 고급 통계 모형이나 외면 받았던 다양한 새로운 통계 분석 모형이 소개 되었습니다.



또 기존에는 해당 분야의 이론을 배경으로 하여 자신의 확신을 데이터에 검증하는 수준에 멈추었으나
데이터 마이닝은 광대한 디비 데이터를 다루기 때문에 일종의 미지의 영역을 탐험하는 탐색적인 접근법을 많이 사용합니다.



예를 들어 마트의 경우를 들면 마트가 취급하는 품종은 이루 말할 수 없이 많습니다. 가공 면 종류만 해도
현재 각 회사별로 라면,짜장면,우동,냉면(비빔,물)등 다양하게 나와 있어 눈대중으로 해도 수 십개의 물품으로
세 분류 할 수 있습니다.



더구나 이 많은 상품을 마트 각 체인점에서 하루에도 수 십만건의 거래가 이루어 지고 있습니다. 이런 데이터가
일년만 쌓였다고 생각해 봅시다. 어마 어마 한 데이터 입니다.



이런 데이터 속에서 고객과 물품간의 관계성,패턴을 찾아
낸다는 것은 마치 거대한 산맥에서 곡괭이로 땅을 파 금을 캐겠다는 것과 비슷하겠지요.



그래서 데이터 마이닝이란 이름이 붙었습니다.