포레스터 리서치(Forrester Research)의 빅데이터 분석가들이 내놓은 새로운 보고서에 따르면, 데이터에 대해 고급 분석을 수행하고 실용적인 시야를 얻고자 하는 조직에게 하둡 도입은 "필수"다.
Credit: thinkstock
포레스터는 기업이 보유한 데이터의 60~73%가 비즈니스 인텔리전스와 분석에 사용되지 못하고 방치된다고 추산했다. 분석가 마이크 괄티에리와 노엘 유한나는 지난주 공개한 하둡 배포판에 대한 웨이브(Wave) 보고서에서 "이는 특히 고객에 대한 심층적이고 실용적인 시야가 경쟁을 위한 필수 요소인 시대에서 용납할 수 없는 수준"이라고 말했다.
또한 애플리케이션 개발자와 제공 전문가가 '일제히' 하둡을 수용 중이라면서, 대기업들은 결국 100% 하둡을 도입하게 될 것으로 예측했다.
다만 포레스터는 하둡이 복잡한 시장임을 지적했다. 그렇다면 어느 벤더를 선택해야 할까?
하둡 시장에는 절대적이고 유일한 승자는 없다. 대신 각자 강점과 서로 다른 경쟁력을 가진 벤더들이 있고 물론 특정 분야에서 자신만의 매력을 가진 벤더들도 있다.
하둡 최상위 계층에는 클라우데라(Cloudera), 호튼웍스(Hortonworks), 맵R(MapR), 그리고 IBM과 피보탈(Pivotal)이 있다. 이 5개 업체가 포레스터가 선정한 최상위 하둡 소프트웨어 배포 업체다.
포레스터는 이 업체들이 모두 보안, 스케일, 통합, 거버넌스, 성능과 같은 주요 엔터프라이즈 기능에 초점을 두고 있다고 전했다. 고객사에 배포하거나, 프라이빗 또는 퍼블릭 클라우드에 배포하고 소프트웨어 관리를 고객이 직접 하는 방법도 가능하다.
아마존 웹 서비스의 엘라스틱 맵리듀스(Elastic MapReduce) 또는 마이크로소프트 애저의 HD인사이트(HDInsight)와 같은 클라우드 기반 하둡 배포판은 고객이 자체 하드웨어에서 실행할 수 없는 퍼블릭 클라우드 전용 제품이므로 포레스터의 웨이브 보고서의 평가에서 제외됐다.
이 보고서는 2008년에 설립된 클라우데라를 리더로 선정했다. 클라우데라는 포레스터가 벤더 비교에 사용한 30가지 평가 기준에 따라 현재 제공하는 항목과 시장 지배력 측면에서 가장 높은 점수를 받았다. 클라우데라는 오픈 소스 하둡 소프트웨어를 재료로 해 독자적인 변경을 통해 소프트웨어의 보안과 고가용성, 거버넌스, 관리 측면을 개선한다.
호튼웍스는 클라우데라의 주 경쟁 업체이며 시장 지배력에서 2위 업체다. 호튼웍스는 100% 오픈소스 하둡 배포판을 추구한다. 호튼웍스 배포판의 모든 요소는 오픈소스다.
이런 특성은 고객이 다른 소프트웨어로 마이그레이션을 원하는 경우 절대적인 유연성을 제공하지만 그 대가로 일부 기능이 제한된다. 현재 제공 항목에 대한 평가에서 클라우데라는 5점 만점에 4.53, 호튼웍스는 3.82점을 기록했다.
맵R은 두 번째로 높은 4.34의 평가 점수를 받은 또 다른 유력 업체다. 괄티에리와 유한나는 맵R이 사용 편의성을 극대화하면서 고성능과 확장성의 균형을 맞추는 데 주력한다고 전했다.
IBM은 강력한 경쟁업체로, 특히 현재 분석을 확장해 하둡을 포함하고자 하는 기존 IBM 데이터 고객을 대상으로 강점을 가졌다.
피보탈도 고려할 만한 벤더지만 5개 업체 가운데 현재 제공 항목과 시장 지배력 측면에서 가장 낮은 점수를 기록했다. 클라우드 파운드리(Cloud Foundry) PaaS, 그린플럼(Greenplum) 데이터 관리 소프트웨어 등 피보탈의 다른 데이터 관리 및 애플리케이션 개발 제품과 서비스를 사용하는 고객은 피보탈 하둡 배포판을 손쉽게 통합할 수 있다.
한편 하둡 시장은 아직 사용자가 그렇게 많지는 않다. 지난해 가트너 분석가 머브 애드리안은 가트너 설문 결과를 근거로 응답자의 최대 54%가 2016년에 하둡을 도입할 계획이 없다고 답했음을 전하면서 하둡에 대한 과장된 열기에 일침을 가한 바 있다. editor@itworld.co.kr