Offcanvas

빅데이터 | 애널리틱스 / 애플리케이션

'아직은 막상막하' 하둡 서비스 업체 9곳 장단점 정리

2014.03.20 Brandon Butler  |  Network World


 

호튼웍스(Hortonworks)
클라우데라처럼 호튼웍스는 퓨어-플레이(pure-play) 하둡 업체다. 클라우데라와는 다르게 호튼웍스는 아마도 다른 어떤 개발업체보다도 더 강력하게 오픈소스 하둡 코드를 고수한다.

호튼웍스의 목표는 하둡 생태계와 하둡 사용자를 구축하고 오픈소스 코드를 발전시키는 것이다. 호튼웍스의 플랫폼은 오픈소스 코드를 밀접하게 고수한다. 이 점으로 인해 호튼웍스 측은 개발업체 종속을 막을 수 있어 사용자에게 도움이 된다고 강조한다. 호튼웍스 고객이 이 플랫폼을 떠나고자 할 때면 언제라도 손쉽게 애플리케이션을 플랫폼에서 다른 오픈소스 코드로 이전할 수 있다.

이는 호튼웍스가 오픈소스 코드 위에 다른 가치를 제공하지 않는다는 의미가 아니다. 호튼웍스는 오픈소스 커뮤니티에 플랫폼 개발 작업에 관한 모든 것을 되돌려준다. 바로 그 예가 호튼웍스에서 개발한 툴인 앰바리(Ambari)로, 클러스터 관리와 연관된 프로젝트의 구멍을 막는 역할을 한다.

호튼웍스의 접근방식은 테라데이터, 마이크로소프트, 레드햇(Red Hat), SAP 등의 개발업체로부터 강력한 협력관계를 이끌어냈다.

IBM
기업이 대규모 IT 프로젝트를 떠올릴 때 많은 이들은 IBM을 먼저 생각한다. 이 때문에 IBM은 세계 하둡 프로젝트 시장의 주요 업체 가운데 하나가 되었다. IBM은 이미 100여 곳의 하둡 배치를 완료했으며, 이 가운데에는 많은 고객들은 PB급 데이터를 관리 중이다. IBM은 그리드 컴퓨팅, 글로벌 데이터센터, 기업 이행 경험에서의 막대한 경험을 빅데이터 프로젝트에 활용한다.

포레스터는 'IBM' 로드맵에는 빅인사이트 하둡(BigInsights Hadoop) 솔루션과 SPSS 고급 애널리틱스, 고성능 컴퓨팅을 위한 작업부하 관리, BI 툴, 데이터 관리와 모델링 툴 같은 연관 IBM 자산과의 지속적인 통합이 포함되어 있다"고 말했다.

인텔(Intel)
아마존 웹 서비스처럼, 인텔은 자체 하둡 버전을 활용, 최적화하는데 특히 자체 생산된 제온(Xeon) 칩 하드웨어상에서의 구동에 중점을 뒀다. 자체 하둡 시스템의 극한을 끌어내면서 소프트웨어와 하드웨어 사이의 밀접한 연동을 찾는 고객들에게 인텔의 하둡 배포판이 적합할 수 있다.

포레스터는 인텔이 최근 출시한 제품을 통해 기업들이 현재 시장에 나온 버전에 더 많은 혁신을 기대할 수 있다고 말했다. 인텔과 마이크로소프트는 하둡 시장에서의 '강력한 경쟁자'로 분류되어 있으며, 기존 시장에서의 '시장 선도자'와는 위치가 다르다.

맵R 테크놀로지(MapR Technologies)
맵R 테크놀로지는 많은 사람이 들어보지 못한 가장 좋은 하둡 배포 업체일 것이다. 포레스터가 웨이브 보고서를 작성할 때 실시한 하둡 사용자 조사에서 맵R은 현재 제품으로는 가장 높은 평점을 받았고, 배포판의 아키텍처와 데이터 프로세싱 능력에서도 가장 높은 점수를 획득했다.

맵R 테크놀로지의 비법은 맵R이 자체 하둡 버전에서 이끌어낸 독특한 기능성 조합에 있다. 예를 들어, 맵R의 배포판은 NFS(Network File Systems)를 지원하며, 맵R은 재난 복구와 고가용성 기능을 배포판에 담았다.
포레스터는 맵R이 단지 브랜드 인지도에 있어서만 클라우데라와 호튼웍스보다 뒤처질 뿐이라고 평가했다. 더욱 많아지는 협력 관계와 마케팅은 맵R을 주류 하둡 업체로 성장시킬 수 있을 것이다.

마이크로소프트(Microsoft)
마이크로소프트는 전통적으로 오픈소스 소프트웨어에 친화적이지 않은 기업으로 알려져 있지만, 이번에는 하둡을 윈도우상에서 활성화할 뿐 아니라 하둡 생태계를 더욱 넓힐 수있는 오픈소스 프로젝트 코드도 내놓고 있다.

이런 노력의 결실은 마이크로소프트의 퍼블릭 클라우드 윈도우 애저(Windows Azure)의 HD인사이트(HDInsight) 제품에서 나타났다. HD인사이트는 서비스로의 하둡 제품으로 호튼웍스의 플랫폼 배포판에 기반하고 있지만 애저상에서 실행되도록 설계됐다.

마이크로소프트는 다른 훌륭한 프로젝트도 진행하고 있는데, 여기에는 SQL서버 상의 정보가 하둡 쿼리상으로도 검색되도록 하는 폴리베이스(Polybase)라는 데이터 처리 엔진도 포함된다. 포레스터는 "마이크로소프트의 데이터베이스, 데이터웨어하우스, 클라우드, OLAP, BI, 스프레드시트(파워피봇(PowerPivot)), 협업, 개발 툴 시장에서의 상당한 존재감은 마이크로소프트 고객에게 성장하는 하둡 스택을 제공할 때 장점으로 작용한다"고 평가했다. 인텔처럼 마이크로소프트는 '강력한 경쟁자'로 분류됐지만, 이 업계에서 선두주자는 아직 아니다.

피보탈 소프트웨어(Pivotal Software)
지난해 EMC와 VM웨어는 양사의 상당한 자산을 합쳐 피보탈이라는 별개의 독립 업체를 설립했다. 피보탈의 가장 큰 영업 분야는 하둡 배포와 클라우드 파운드리 PaaS(Cloud Foundry Paas)다. 피보탈은 오픈소스 코드상에 몇 가지 툴을 추가했는데, 특히 HAWQ라는 SQL 엔진과 빅데이터 플랫폼을 실행하기 위해 특별히 만들어진 하둡 어플라이언스 등이 있다.

피보탈 하둡 플랫폼이 갖고 있는 최고의 장점은 자체 배포판과 다른 피보탈, EMC와 VM웨어 제품들간의 통합에 있다. 피보탈은 자체 EMC와 VM웨어 지원의 혜택을 받고 있다. 하지만 포레스터는 현지까지 피보탈의 구축 경험은 100건에도 미치지 못하는데, 그것도 대부분 중소 규모의 고객이라고 지적했다.

테라데이타(Teradata)
테라데이타와 같은 업체들은 하둡을 위협요소이자 기회로 본다. 테라데이타는 데이터 관리, 특히 SQL과 관계형 데이터베이스 측면에 강점을 보이는 업체다. 그러므로 하둡 클라우드같은 NoSQL 플랫폼은 테라테이타에 위협이 될 수 있다. 이 대신 테라데이타는 하둡을 받아들였다.

호튼웍스와의 협력관계 체결을 통해 테라데이터는 이제 고객들에게 즉각 사용이 가능한 형태로 자동적으로 테라데이터 웨어하우스에 저장된 데이터와 매끄럽게 작동되도록 자체 SQL과 통합된 하둡 플랫폼을 사용할 수 있는 능력을 제공하고 있다. editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.