반응형
Data Mining(데이터 마이닝)은 대용량의 데이터로부터 정보와, 미래에 대한 예측을 할 수 있는 자료의 관계, 규칙, 패턴 등을 찾아내고, 이를 모형화하여 의미 있는 지식을 찾아내는 과정 또는 분석 방법을 말한다. 대표적인 데이터 마이닝 기법에는 분류(Classification), 추정(Estimation), 예측(Prediction), 연관분석(Association Analysis), 군집(Clustering), 기술(Description)이 있다.
분류기법은 새로운 현상을 기존의 분류, 정의된 집합에 배정하는 것으로, 의사결정 나무(decision tree), memory-based reasoning 등이 있다. 추정은 입력 데이터를 사용하여 알려지지 않는 결괏값을 추정하는 것으로, 신경망 모형이 있다. 예측은 미래 값을 예측하거나 추정하는 것으로, 장바구니 분석, 신경망, 의사결정 나무 등을 사용한다. 연관분석은 레코드의 연관성을 파악하는 분석으로 장바구니 분석을 사용한다. 군집은 레코드 간의 유사성에 따라 그룹화하거나 세분화하는 것을 말한다.
데이터 마이닝은 다음과 같이 5단계 따라 이루어진다.
목적 정의 → 데이터 준비 → 데이터 가공 → 데이터 마이닝 기법 적용 → 검증
반응형
LIST
'Big Data' 카테고리의 다른 글
MySQL 설치하기 (0) | 2023.01.14 |
---|---|
DB-Engines Ranking (0) | 2023.01.13 |
Data Warehouse(데이터 웨어하우스) (0) | 2022.07.22 |
Big Data(빅 데이터) (0) | 2022.05.31 |
댓글