“빅 데이터의 핵심 개념은 어느 날 갑자기 나온 것이 아닙니다. 개념과 방법론은 오래 전부터 존재했죠. 환경과 인프라가 부족해 오늘날처럼 이용할 수 없었던 것입니다. 즉 빅 데이터는 하둡, 인메모리 기술, 클라우드 컴퓨팅 등의 기술이 확산되면서 대용량 비정형 데이터를 다룰 수 있게 됨에 따라 등장한 용어입니다.”
조 대표는 먼저 빅 데이터라는 용어에 대한 진단으로 이야기를 시작했다. 과거 ‘마이닝’이라고 불렸던 분석기술, 스코어링 기술 등이 이미 비슷한 개념이며, SAS만 하더라도 15년 전부터 텍스트 애널리틱스 작업을 해왔다고 그는 설명했다.
“시장에 ‘오해’가 존재한다고 봅니다. 빅 데이터 스토리지 기업은 대용량 데이터를 담을 수 있는 스토리지 신제품에 빅 데이터를 거론합니다. 하둡 전문 기업은 하둡이 빅 데이터의 핵심인 것처럼 이야기하죠. 물론 ‘볼륨’과 분산형 파일 시스템이 빅 데이터의 주요 특징이기 합니다. 그러나 빅 데이터의 본질적 핵심은 데이터에서 가치를 찾아내는 것이어야 한다고 봅니다.”
그는 그저 방대한 데이터를 모아놓는다고 ‘빅 데이터’가 되는 것은 아니라며, 용량(Volume), 다양성(Variety), 생성 속도(Velocity)로 일컬어지는 빅 데이터의 3V 정의에 덧붙여 가치(Value)를 덧붙여 생각해야 한다고 강조했다.
동의할 수 있는 지적이다. 빅 데이터가 시대의 화두로 부상하면서 수많은 벤더들이 저마다의 빅 데이터를 규정하고 각자의 솔루션을 제시하고 있다. '빅 데이터 2.0', '빅 데이터 3.0'이라는 다분히 마케팅적인 규정도 그렇게 등장하고 있다. 하지만 기업 전체의 관점에서 핵심은 어떤 가치를 어떻게 창출하느냐일 것임 분명하다.
“IT의 진화 과정을 살펴볼 수도 있을 것 같습니다. 초창기에는 그저 데이터가 존재했습니다. 자동화 개념이 IT의 전부였습니다. 여기에 가치를 부여하면서 인포메이션이라는 용어가 사용되기 시작했고 거기에서 또 지식(knowledge)라는 용어로 이어졌습니다. 그 다음에는 인텔리전트라는 말이 많이 나왔습니다.”
조 대표는 이제 최적화(Optimization), 현대화(Modernization)라는 단어로 발전하는 양상이라고 진단했다. 폭증하는 데이터에 적응하고 과거 데이터를 대응하는 것 뿐 아니라 예측과 사전적(Proactive) 대응을 하는 방향으로, 즉 의사결정을 지원하는 방향으로 진화하고 있다고 그는 설명했다.
“그리고 이제 사물인터넷(IoT)까지 등장하고 있습니다. 데이터가 더욱 폭증할 것이라는 이야기입니다. 쉽지 않은 과제입니다만 기업의 경쟁력은 이러한 방대한 데이터를 활용해 어떻게 의사 결정에 반영할지, 수십 억 건의 데이터를 어떻게 실시간으로 분석할지에 따라 좌우될 것입니다.”