Offcanvas

빅데이터 | 애널리틱스 / 애플리케이션

하둡으로 가는 길 | 제2부 하둡 대 RDBMS 비용

2012.01.12 Brian Proffitt  |  ITWorld
하둡 무료 소프트웨어를 전부 설치한다고 가정할 때, 하나당 4,000달러인 노드 100개 비용을 3년 간 분할상환하고 엔지니어는 15만 달러의 봉급을 받는다고 가정하면 다음과 같은 계산이 나온다:

시간당 하드웨어 비용(총 3년간): 15.21달러

시간당 유지 비용: 17.11달러


이를 합산하면 전체 시스템의 운용비용은 시간당 32달러 혹은 연간 283,320달러(전기 요금 제외)가 된다.

한편 유사한 규모의 RDBMS 시스템을 생각해보면 오라클은 지난 2008년 저장용량이 168TB인 데이터베이스 기기의 가격을 하드웨어에 65만 달러, 소프트웨어에 168만 달러로 책정했다. 따라서 이 시스템은 TB당 1만 4,000 달러 수준이라는 엄청난 비용이 든다. 오라클 데이터베이스 관리자의 연봉이 약 9만 5,000 달러라고 가정할 때 운용 비용은 다음과 같이 계산할 수 있다.

시간당 하드웨어 비용 (총 3년간): 88.60달러

시간당 유지 비용: 10.27달러


여기에서 오라클 관리자의 연봉을 낮추고 하둡 엔지니어에게 훨씬 많은 웃돈을 지불하게 되면 오라클 시스템의 운용 비용은 시간당 98.87달러 연간 86만 6,694달러가 될 것이다. 이는 유사한 규모의 하둡을 배치할 때보다 세배가 넘는 비용으로 그 차이가 매우 크다.

RDBMS의 성능을 낮춘다 하더라도 비용(TB당 1만 달러)의 감소폭은 그렇게 크지 않다. 이 수치를 합산하면 연간 비용은 64만 4,827달러가 되며 이는 여전히 하둡 분산형 시스템보다 1.8배나 많은 금액이다.  

물론 위에서 말한 것들은 운용비용일 뿐이며 마이그레이션 비용이나 외부 업체를 이용할 경우 계속되는 하둡 지원에 대한 비용 등은 고려하지 않았다. 그러나 둘 사이의 비용차이가 워낙 크기 때문에 하둡 관리에 어느 정도의 할증료를 더 지불한다 하더라도 여전히 기업들은 장기적으로 비용을 절약할 커다란 기회로 삼을 수 있을 것이다.

다음 편에서 다룰 내용들
더 저렴한 하드웨어 비용과 데이터에서 최대한 많은 것들을 얻어내고자 하는 모든 규모의 기업들에게 제공될 강력한 비즈니스 이점들 등 하둡의 장점들이 대기업과 중소기업 영역에서 아주 많은 관심을 모으고 있다.

‘하둡으로 가는 길 | 제3부’에서는 기존의 RDBMS에서 하둡으로 이전할 때의 비용과 관련 기술들을 살펴보며 기업들이 현재 어떻게 하둡을 시험하고 있는지를 알아보고 하둡 데이터를 다른 어떤 RDBMS보다 훨씬 빠르고 저렴하게 분석하는데 사용되는 툴들을 알아볼 것이다.

하둡을 이용하지 않아야 하는 경우는?
머시는 하둡 배치에 따른 잠재성에 대해 매우 열광적이지만 기업에서 하둡으로의 이동을 고려할 때 반드시 유념해야 할 몇 가지 제약 사항들이 있다.

우선 기업이 데이터에서 초 단위 이하(sub-second)로 상호적으로 보고하고 있거나 혹은 데이터를 다단계로 복잡한 트랙젝션에서 이용하고 있다면, 하둡이 이러한 영역들에 특히 강하지 않기 때문에 RDBMS를 그대로 사용하는 편이 좋다. 또한 데이터가 삽입과 삭제를 통해 갱신되고 업데이트되는 경우에도 역시 하둡을 사용하지 않는 편이 좋다.

*Brian Proffitt는 베테랑 리눅스 및 오픈소스 저널리스트이자 애널리스트로 클라우드, 가상화 및 소비자 IT에대한 다년간의 경력을 가지고 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.