Big Data(빅 데이터)는 다양한(Variety) 형태의 데이터로, 생산되는 속도가 빠르고(Velocity)와 양이 방대하여(Volume) 기존의 방법과 도구로 데이터를 수집, 저장, 분석이 어려운 데이터입니다. 앞의 3V를 기반으로 데이터를 실시간으로 분석하여 가치(Value)를 창출할 수 있습니다.
데이터 유형은 데이터베이스, 스프레드 시트, 사무정보와 같은 정형 데이터에서 시스템 로그(system log), 센서 데이터, HTML 등의 반정형 데이터 그리고 멀티미디어, 이메일, 문서, SNS와 같은 비정형 데이터, 사물정보, 인지정보 데이터로 유형이 다양해지고, 생산되는 데이터의 양이 어마어마하게 커지고 있습니다. 반면, 빅 데이터를 저장하는 비용은 점점 낮아지고 있습니다. 또한 데이터의 실시간 분석 시간이 분산처리기술의 도입으로 낮아져 효율성이 극대화되고 있습니다.
데이터 분석(Data Analysis)이란 대량의 데이터로부터 숨겨진 패턴과 알려지지 않은 정보 간의 관계를 찾아가는 과정으로, 데이터를 통해 의미있는 결과를 도출해내는 것을 의미합니다. 분석 단계에서는 비즈니스 및 사회 과학 영역의 데이터를 기반으로 다양한 분석 기법들을 활용하여 데이터를 파악합니다. 빅 데이터 분석 후 활용한 예를 Amazon의 예측 배송, Netflix의 콘텐츠 추천 서비스 등이 있습니다.
데이터 분석 작업을 하는 사람을 데이터 사이언티스트(Data Scientist)라고 부릅니다. 이들은 컴퓨터, 과학, IT, 수학, 통계학, 도메인, 경제 지식 등을 활용하여 데이터 수집, 분석 및 회사에서 필요한 전략적인 인사이트를 제공하는 전문가입니다.
'Big Data' 카테고리의 다른 글
MySQL 설치하기 (0) | 2023.01.14 |
---|---|
DB-Engines Ranking (0) | 2023.01.13 |
Data Warehouse(데이터 웨어하우스) (0) | 2022.07.22 |
Data Mining(데이터 마이닝) (0) | 2022.07.02 |
댓글