Offcanvas

BI / 빅데이터 | 애널리틱스 / 애플리케이션

하둡으로 가는 길 | 제3부 RDBMS에서 하둡으로 전환

2012.01.18 Brian Proffitt  |  ITWorld


하이브는 또한 HiveQL언어가 필요한 정보를 제공할 수 없다고 판명된 경우, 맵리듀스 프로그래머들이 직접 그들이 만든 데이터 매퍼(data mapper)와 데이터 리듀서(data reducer)를 불러오게 할 예정이다.

단 하이브를 고려할 때 다음의 한 가지를 주의해야 한다: 하둡은 일괄 처리 시스템(batch processing system)이기 때문에 매우 높은 지연시간을 가지는 하이브 쿼리들로 옮기는 과정에서 아주 높은 지연시간을 가진다(몇 초가 아니라 몇 분이 될 수도 있다). 따라서 하이브는 실시간 프로세싱에 적합한 시스템이 아니다. 실시간 프로세싱이 필요하다면 아파치 카산드라(Apache Cassandra)를 이용하는 편이 좋다. 카산드라는 오픈소스 분산형 데이터베이스 관리 시스템으로 실시간 요구들을 처리하는데 훨씬 적합하다.

하둡에 이르는 길
하둡으로 데이터 마이그레이션하는 경로는 기업의 필요에 따라 다양할 것이지만, 하둡은 분명 엄청난 가치를 제공하며 당신을 놀라게 만들어줄 것이다.

하둡은 엄밀한 의미에서 빅 데이터으로 국한되지 않는다. 더 저렴한 저장공간을 필요로 하고 엄청난 양의 데이터를 효율적으로 분석하고자 하는 기업이라면 어디든지 사용할 수 있다. 귀사에는 하둡이 필요하지 않나?

*Brian Proffitt는 베테랑 리눅스 및 오픈소스 저널리스트이자 애널리스트로 클라우드, 가상화 및 소비자 IT에대한 다년간의 경력을 가지고 있다. ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.