Offcanvas

경력관리 / 빅데이터 | 애널리틱스 / 애플리케이션

빅 데이터 기술, 어려운 맵리듀스 대신 캐스케이딩 부상

2012.06.08 Thor Olavsrud   |  CIO


통합 마케팅 퍼포먼스 관리 전문 기업 업스트림 소프트웨어(Upstream Software)의 CTO 브랜든 메이슨은 “맵리듀스를 아는 인재를 찾는 일은 매우 어렵다. 때문에 그들에 대한 수요는 폭발적으로 증가하고 있다”라고 말했다. 업스트림은 코어메트릭스 로그(Coremetrics log)나 옴니추어(Omniture) 로그, 구매자 이용 키워드, 다이렉트 메일(DM, Direct Mail) 로그, 그리고 이메일 로그 등 고객이 보유한 모든 마케팅 데이터를 분석해 그들이 적절한 마케팅 믹스(marketing mix)를 진행할 수 있도록 지원하는 회사다. 메이슨은 “뒤죽박죽 섞여있는 이 데이터들을 제대로 분석하기 위해 우리는 수 많은 데이터 세트를 다룰 수 있는 플랫폼을 갖춰야 할 필요가 있다”라고 설명했다.

오픈소스 캐스케이딩은 맵리듀스의 대안
캐스케이딩(Cascading)은 맵리듀스에 대한 대안 API로 설계된 독립형 오픈소스 자바 애플리케이션 프레임워크다. 캐스케이딩은 자바 개발자들이 그들의 기존 기술을 활용해 하둡 환경에서 빅 데이터 애플리케이션을 개발할 수 있도록 지원한다.

캐스케이딩을 제작한 크리스 웬슬은 “딱 한번 맵리듀스를 사용해 봤다. 그리고 다시는 이를 사용하지 않겠다고 다짐했다. 이렇게 개발된 것이 바로 캐스케이딩이다”라고 말했다.

웬슬은 2007년 오픈소스 프로젝트로 캐스케이딩을 제작했고, 현재는 캐스케이딩 범용으로 개발에 이용하는 빅 데이터 애플리케이션 플랫폼 업체인 컨커런트(Concurrent)의 CEO다. 현재 컨커런트가 지원하는 기업들로는 트위터나 엣시(Etsy), 업스트림 등이 있다. 트위터에는 캐스케이딩을 활용해 트윗 컨텐츠와 광고 캠페인, 사용자 활동 등으로부터 생산되는 대량의 데이터를 분석하는 정교한 통계 작업을 수행하는 세 개의 내부 팀이 갖춰져 있다. 그리고 엣시는 65개의 캐스케이딩 애플리케이션을 활용해 그들의 웹 로그와 데이터베이스로부터 기업의 전자상거래 사이트에 새로운 기능을 추가하거나 사용자 행동 양식과 A/B 사이트 테스팅을 확인하고 검토하는데 필요한 데이터들을 추출하고 있다.

지난 화요일 컨커런트는 아파치 2.0 라이선스 협정(Apache 2.0 License Agreement)에 기반한 캐스케이딩 2.0을 공개했다. 여기에는 사용자들이 그들의 컴퓨터로 개발이 진행 중인 빅 데이터 애플리케이션을 신속하게 테스트할 수 있도록 지원하는 인 메모리 프로세싱과 같은 새로운 기능들이 포함됐다. 메이슨은 업스트림이 이미 두 달여 전 캐스케이딩 2.0으로의 전환 작업을 완료했다고 밝혔다. 빅 데이터 활용 능력에 따라 죽고 사는 회사의 CTO로서 메이슨은 캐스케이딩의 새로운 기능에 열광한 게 아니라 업스트림의 요구를 충족시킬 팀을 좀더 쉽게 구축하는데 캐스케이딩을 사용할 수 있다는 데에 만족했다.

자바 개발자들의 빅 데이터 영역 진출
메이슨은 “인재를 모집해 팀을 꾸리는 과정이 한결 수월해졌다. 캐스케이딩은 자바의 형태와 운용 방식을 가져왔다. 우리는 이미 자바에 매우 익숙해져 있는 전문가들을 팀의 일원으로 받아들일 수 있게 되었다. 이 변화를 통해 교육 기간은 매우 단축됐다”라고 설명했다.  

그는 자바 개발자들이 그들의 자바 기술을 캐스케이딩에 적용하기 위해 기본적인 하둡 지식을 익히는 과정에도 수 주의 시간이 걸리겠지만, 이는 맵리듀스를 배우는 노력에 비하면 아무것도 아니라고 강조했다.

그는 “물론 학습의 필요성이 완전히 사라진 것은 아니다. 그러나 맵리듀스를 배우는 것은 매우 복잡하고 많은 시간이 소요되는 과정이다. 하지만 캐스케이딩은 이 문제를 해결해 우리에게 큰 도움이 됐다. 개발자들에게는 여전히 맵리듀스의 개념을 이해하는 노력이 요구되겠지만, 이제 그들이 복잡한 맵리듀스의 늪에 발을 담가야 할 필요는 없어졌다”라고 설명했다. ciokr@idg.co.kr
 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.