Offcanvas

BI

하둡, 비정형 데이터라는 틈새 시장 뚫었다

2011.08.26 Jaikumar Vijayan  |  Computerworld
대규모 정형•비정형 데이터를 관리하고자 하는 기업들의 수요가 증대됨에 따라 기업들이 오픈소스 아파치 하둡 소프트웨어 꾸준히 도입하는 것으로 조사됐다.

벤타나 리서치(Ventata Research)가 지난 달 말에 발표한 보고서에 따르면, 하둡이 기존 기술을 대체하는 대신, 전통적인 관계형 DBMS 못지 않게 작동하고 있는 것으로 나타났다.

하둡은 PB급 데이터를 관리하고 처리하도록 설계됐다. 이 기술은 대용량 데이터를 더 작은 데이터 블록으로 쪼개는 능력이 관건이며 작은 데이터 블록은 더 빠르게 처리하도록 제작된 하드웨어의 클러스터를 통해 공급된다.  

하둡을 도입한 얼리 어답터로는 페이스북, 아마존, 이베이, 야후 등이 있다. 이들은 전통적인 관계형 DBMS로는 하기 어려운 PB급 비정형 데이터를 분석하는 데 하둡을 사용하고 있다. 160개 이상이 기업을 대상으로 한 조사를 토대로 작성한 벤타나의 보고서는 최근 기업들이 얼리 어답터들과 비슷한 목적으로 사용하기 위해 하둡을 도입하고 있으며 이 추세는 빠르게 증가하고 있다고 강조했다.  

그 기업들 대부분은 로그, 이벤트 데이터, 검색엔진 결과, 소셜 미디어 사이트의 콘텐츠 등의 비정형 데이터의 방대한 양을 분석하고 모으는 데 하둡을 사용하고 있는 것으로 조사됐다고 벤타나 보고서의 저자 데이비드 메닝거는 밝혔다.

“3개 기업 중 2개가 하둡을 고도화된 분석과 다양한 형태의 분석을 위해 하둡을 사용하는 것으로 나타났다. 특히 그것은 그들이 과거에는 하지 못했던 방식의 새로운 분서들이다”라고 메닝거는 덧붙였다.

전통적은 RDBMS 툴을 최고로 여기는 거래데이터, 고객 정보, 콜센터 등의 정형 데이터를 분석하는 데 하둡이 쓰일 것 같지는 않다고 메닝거는 주장했다.

하둡의 부상하고 있지만. 이를 사용하는 기업들은 여전히 보안, 클러스터링, 하둡 기술자 부족 등을 해결해야 한다고 이 보고서는 밝혔다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.