IBM, 호튼웍스, 피보탈 등 다수의 대형 빅데이터 업체들이 오픈소스 하둡 데이터 처리 소프트웨어를 위한 하둡 기반 공통 플랫폼을 만들고자 손잡았다.
오픈 데이터 플랫폼은 복잡한 하둡 기반의 데이터 분석 시스템을 구축하고 유지하기 위해 기업의 각 부문들에 필요한 작업을 줄이면서 전체적으로 원활하게 함께 실행할 아파치 하둡과 아파치 하둡의 지원 소프트웨어의 특정 버전을 파악하게 될 것이다.
하둡 업체인 알티스케일(Altiscale)의 CEO 레이미 스타타는 성명서에서 "점점 더 많은 기업들이 아파치 하둡의 비즈니스 가치를 알게 됨에 따라 까다로운 테스팅과 잘 정의된 배포판에 대한 요구가 늘고 있다”라고 밝혔다.
오픈 데이터 플랫폼은 빅데이터 솔루션 및 서비스 업체들이 엔터프라이즈 급 솔루션을 인증할 수 있는 데 대한 입증된 자료를 제공할 것이라고 스타타는 전했다.
하둡의 코드베이스는 아파치 소프트웨어 재단에서 관리한다. 리눅스 운영체제 커널과 마찬가지로 하둡은 다양한 업체들이 상용 배포판으로 패키지를 만들었으며 모든 배포판들이 상호 호환되는 것은 아니다. 복잡성이 더해지면서 하이브, 앱바리, 주키퍼(ZooKeeper)같은 많은 관련 하둡 프로그램들이 생겨났으며 이들을 하둡으로 통합하려면 별도의 작업이 필요할 수 있다.
이러한 접근 방식은 공통 핵심 컴포넌트인 리눅스 표준 기반을 개발하는 리눅스재단의 취한 방법과 비슷하다.
오픈 데이터 플랫폼은 하둡용 공통 라이브러리를 만들어 어떤 기술이 간편하게 사용될 수 있고 이 기술을 이용한 어떤 업체들이 서로 잘 맞는지를 이해하는 프로세스를 간소화할 것이다. 기업들은 각기 다른 업체에서 가져온 다양한 하둡 콤포넌트를 골라서 사용하면서, 커스터마이징 없이 바로 쓸 수 있는 소프트웨어를 자사의 하둡 시스템으로 더욱 쉽게 통합할 수 있게 된다.
IBM, 호튼웍스, 피보탈 이외에 공통 하둡 플랫폼 개발에 참여하겠다고 밝힌 기업으로는 제너럴일렉트릭(GE), 인포시스, SAS 알티스케일, 캡제미니, 퀘스트, EMC, 스플렁크 버라이즌 엔터프라이즈 솔루션, 테라데이타, VM웨어 등이 있다. ciokr@idg.co.kr