Data Mining(데이터 마이닝)
Data Mining(데이터 마이닝)은 대용량의 데이터로부터 정보와, 미래에 대한 예측을 할 수 있는 자료의 관계, 규칙, 패턴 등을 찾아내고, 이를 모형화하여 의미 있는 지식을 찾아내는 과정 또는 분석 방법을 말한다. 대표적인 데이터 마이닝 기법에는 분류(Classification), 추정(Estimation), 예측(Prediction), 연관분석(Association Analysis), 군집(Clustering), 기술(Description)이 있다. 분류기법은 새로운 현상을 기존의 분류, 정의된 집합에 배정하는 것으로, 의사결정 나무(decision tree), memory-based reasoning 등이 있다. 추정은 입력 데이터를 사용하여 알려지지 않는 결괏값을 추정하는 것으로, 신경망 모형..
2022. 7. 2.
Big Data(빅 데이터)
Big Data(빅 데이터)는 다양한(Variety) 형태의 데이터로, 생산되는 속도가 빠르고(Velocity)와 양이 방대하여(Volume) 기존의 방법과 도구로 데이터를 수집, 저장, 분석이 어려운 데이터입니다. 앞의 3V를 기반으로 데이터를 실시간으로 분석하여 가치(Value)를 창출할 수 있습니다. 데이터 유형은 데이터베이스, 스프레드 시트, 사무정보와 같은 정형 데이터에서 시스템 로그(system log), 센서 데이터, HTML 등의 반정형 데이터 그리고 멀티미디어, 이메일, 문서, SNS와 같은 비정형 데이터, 사물정보, 인지정보 데이터로 유형이 다양해지고, 생산되는 데이터의 양이 어마어마하게 커지고 있습니다. 반면, 빅 데이터를 저장하는 비용은 점점 낮아지고 있습니다. 또한 데이터의 실시간..
2022. 5. 31.