'빅 데이터'만큼 활발히 회자되는 유행어도 드물다. 그리고 이에 따른 과장이 존재하는 것도 사실이다. 그러나 빅 데이터 전략을 개발할 수 있는 공식적인 방안들이 마련되고 있는 등, 빅 데이터가 현실 세계에서의 성공을 향해 진군을 개시하는 양상이라고 몇몇 IDC 애널리스트들이 평가했다.
IDC 애널리스트 댄 베세트는 13일 보스턴에서 열린 회사의 디렉션 2013 컨퍼런스에서 "수많은 과장과 광고가 명백히 존재하는 시점이다. 문제는 현실은 무엇이냐는 것, 그리고 기업들이 단기적으로 무엇을 할 수 있느냐는 것이다"라고 말했다.
그는 이어 빅 데이터에 대한 IDC의 정의를 소개했다. "광범위한 출처로부터 비롯된 대용량 데이터에서 추출해 새로운 경제적 가치를 창출하는 정보 주도적이고 전술적 의사 결정"이라는 설명이다.
베세트는 최초의 '의사 결정'이라는 문구가 결정적으로 중요하다고 강조했다. 그는 "모든 종류의 기술을 설치할 수 있을 것이다. 그러나 중요한 것은 의사 결정을 개선시키는 것"이라며, "최상의 하둡 솔루션을 가질 수는 있다. 그러나 그것으로는 충분치 않을 것"이라고 덧붙였다.
베세트와 함께 프리젠테이션한 마이클 베르사체 애널리스트는 기업 변혁을 위해 빅 데이터 프로젝트를 활용하는 기업 중 하나로 프로그레시브(Progressive)를 언급했다. 그에 따르면 이 보험회사는 가입자의 운전 습관에 기반한 정보를 활용해 개인별 맞춤 가격 전략 모델을 개발했다.
좀더 자세히 설명하면 프로그레시브는 자동차의 진단 포트에 연결된 기기를 통해 데이터를 수집한다. 운전자의 급제동, 야간 운전 빈도, 이외의 여타 위험한 운전 습관 등을 기록한다. 운전 습관이 안전하다고 판단될수록 가격은 유의미하게 저렴해진다.
베세트는 이 밖에 성공적인 빅 데이터 프로젝트를 출범하기까지는 많은 과제들이 존재한다고 강조했다. 여기에는 어떤 데이터를 저장하고 어떤 데이터를 폐기해야 할지, 기술을 확보하는데 필요한 비용, IT 전문 인력의 부족 등이 포함된다. 베세트는 특히 인력 문제가 심각하다며 조만한 더욱 심화될 문제이기도 하다라고 덧붙였다.
이 밖에 빅 데이터에 대한 몇몇 오해도 남아있는 실정이라는 지적이다. 베세트는 "대표적인 오해 중 하나는 빅 데이터가 소셜 미디어에만 관련된 것이라는 오해"라고 말했다.
그는 또 하둡만이 유일한 솔루션이 아니라면서, 하둡이 라지 스케일 배치 프로세싱에서 기원하고 있지만 실시간 모니터링은 아니라는 점을 거론했다.
한편 IDC에 따르면 북미 기업의 10~12%가 현재 어떤 형태로든 하둡을 이용하고 있는 것으로 추정된다.
베세트와 베르사체는 IDC가 개발한 빅 데이터 '성숙 모델'에 대해서도 설명했다. 이 모델은 5가지 주제 영역으로 구성된다. 데이터, 사람, 절차, 기술, 의향이 그것이다. 또 배치는 총 5 단계로 나뉘어진다. '임시적', '편의주의적', '반복 가능한', '관리되는', '최적화된' 등이 그것이다.
이들은 빅 데이터 전략을 개시하려는 기업의 첫번째 단계로 기존의 기술과 데이터를 새로운 방법으로 이용하는 기회를 규명하는 것이라고 설명했다. 이 때 퍼블릭 클라우드와 오픈소스 옵션을 염두에 둘 수 있다. 이후 개념 증명 실행과 시제품 등으로 실험을 시작하면 된다는 설명이다.
이렇게 1~2년이 지난 후 빅 데이터 프로젝트로 가시적인 성과를 거든 기업들은 좀더 큰 계획에 빅 데이터를 이용할 명분을 확보하게 된다. 또 이를 이용하고 싶어하는 현업 부서들을 스폰서로 확보할 수도 있을 것이라고 그들은 말했다.
이 밖에 IDC 애널리스트 데이빗 슈브메흘은 빅 데이터로 간주되는 데이터의 80% 정도가 비구조화됐거나 약간 구조화된 정보들이라고 전했다. 여기에는 클릭스트림 데이터, 특허 기록, 연구 기록물, 동영상 등이 포함된다.
그는 이어 이러한 다양성이 이른 바 통합 정보 접근 기술(unified information access technology)의 등장을 초래하고 있다면서, 오라클의 엔데카, IBM의 비비시모와 함께 아티비오와 같은 전문 벤더들이 여기에 해당된다고 말했다.
빅 데이터 도전이 데이터베이스 업계에 영향을 지속적으로 끼칠 것이라는 주장도 나왔다. IDC 칼 올로프슨 애널리스트는 이와 관련해 그래프나 인메모리 데이터베이스 플랫폼의 기술 성장을 지목했다. 그는 또 전통적인 관계형 데이터베이스 또한 변화할 것이라며 "테드 코드(Ted Codd)가 알아보지 못할 수준"에까지 확장될 것이라고 말했다. 테드 코드는 관계형 모델의 아버지로 일컬어지는 인물이다. ciokr@idg.co.kr