Offcanvas

빅데이터 | 애널리틱스 / 신기술|미래

빅데이터 신생기업의 제안 "스토리텔링 기능에 주목하라"

2014.10.21 Joab Jackson  |  PCWorld
데이터를 분석하는 좋은 방법이 있다. 빅데이터(Big Data)를 축적할 수도 있다. 그러나 이러한 것만으로는 통찰력을 얻을 수 없다. 여기에 더해 데이터 공학자들이 이야기를 만들어냄으로써 다른 사람들이 이해할 수 있도록 해야 한다.

지난 주 뉴욕에서 열린 스트라타 + 하둡 월드(Strata + Hadoop World) 컨퍼런스에서 자사의 서비스를 공개한 BI(Business Intelligence) 스타트업 클리어스토리 데이터(ClearStory Data)는 이야기의 힘에 대해 강조했다.

클리어스토리 데이터의 CEO 겸 공동 창업자 샤밀라 샤하니-물리건은 "데이터가 더 복잡해지고 더 많은 데이터의 출처가 생겨나기 때문에 사람들이 일이 발생하는 순서대로 따라갈 수 있는 방식으로 묶어야 한다"라고 말했다.

‘콜래보레이티브 스토리보드’(Collaborative StoryBoards)라 불리는 이 클라우드 서비스는 일련의 데이터 시각화를 마치 영화의 스토리보드처럼 제공한다. 각 장면에는 데이터의 시각화가 포함되어 있으며, 이를 복수의 출처로부터 모아 실시간으로 업데이트 할 수 있다. 또한 각 장면에는 차트를 설명하는 메모가 포함돼 있으며 시간순으로 이전부터 데이터를 재생할 수 있는 기능과 같은 고급 차트 기능을 제공한다.



샤하니 물리건은 콜래보레이티브 스토리보드에 대해, 더 많은 정보를 제공하고 제공된 데이터를 더욱 심도 깊게 파헤칠 수 있도록 하는 BI 대시보드의 대안이라고 설명했다.

그녀는 "스토리보드는 모든 곳에 존재할 수 있는 실시간 데이터를 위해 존재하는 결합조직과도 같다. 데이터가 점차 많아지는 상황에서 결합조직이 없다면 무슨 일이 일어나고 있는지 파악하기 어렵다"라고 말했다.

그녀에 따르면 이 서비스는 실시간 데이터 출처에 연결할 수 있고 복수의 기여자가 손쉽게 업데이트 할 수 있다. 따라서 데스크톱 파워포인트(PowerPoint) 프레젠테이션의 잠재적 대안이 될 수도 있다. 또한 스토리보드는 소유주가 단일한 원본을 유지하도록 하면서도 널리 공유되도록 할 수도 있다.

샤하니 물리건은 복수의 이질적인 데이터 출처들을 손쉽게 사용할 수 있는 방식으로 조합하는 골치 아픈 문제를 해결하기 위해 2011년 클리어스토리 데이터를 설립했다.

이 기업은 잠재적인 기업 고객들을 통한 조사에서 조직들의 74% 가 4 개 이상 데이터 출처로부터 얻은 데이터를 통합하고 싶어한다는 사실을 발견했다. 지금까지 팀이 복수의 데이터 근원과 협업하려 한다면, 반드시 이메일 또는 스프레드시트(Spreadsheet)를 통해 정보를 공유하는 방식에 의존해야 했다.

지난 해 공개된 상용 서비스는 사용자가 다양한 데이터 출처로부터 손쉽게 차트를 구성할 수 있는 방법을 제공했다. 해당 제품은 복수의 데이터 스트림(Stream)과 사용할 수 있는 데이터 분석 플랫폼 아파치 스파크(Apache Spark)를 기반으로 구축돼 있다.

이 서비스를 사용하려면 사용자는 CSV 파일, 스프레드시트, 관계형 데이터베이스 등 하나 이상의 데이터 출처를 업로드 하거나 실시간 데이터 출처에 대한 API 링크를 제공해야 한다. 이 작업이 마무리되면 이 서비스는 데이터를 조합 및 시각화할 수 있는 다양한 방법을 제공하거나 평균을 찾는 등 간단한 수학 연산을 실시한다.

복수의 출처로부터 얻은 데이터를 손쉽게 활용하기 위해 이 기업은 일련의 새로운 데이터를 최상의 상태로 포맷을 설정할 수 있는 방법에 관해 여러 기본적인 가정을 할 수 있는 데이터 인터페이스와 프로파일링 엔진이라는 것을 개발했다. 또한 이 서비스는 시간 또는 장소 등의 측면을 고려하는 일련의 메타데이터(Metadata)를 구축한다.

이 서비스는 메타데이터에서 다양한 데이터 세트, 우편번호, 기간 등에 걸쳐 보편적인 사항을 검색하는 조화(Harmonization) 엔진이라 일컬어지는 일련의 독점적인 코드에 의존하고 있다. 이 작업을 통해 주어진 데이터 세트를 통합할 수 있는 다른 데이터 세트에 관한 권고사항을 제안하는 권장사항이 생성된다. 그 결과 만들어진 그래픽 또는 일련의 시각화는 북마크(Bookmark) 됨으로써 다른 사람들이 보도록 할 수 있다.

본래 콜래보레이티브 스토리보드는 비즈니스 분석을 위한 것이었다. 그러나 현재는경영진 및 임원진을 대상으로 집중 홍보되고 있다. 복수의 기여분을 단일한 프레젠테이션으로 통합할 수 있다는 사실이 마케팅 포인트다.

스토리보드 작업을 통해 팀 리더는 프로젝트를 시작할 수 있고 복수의 기여자들은 자신만의 그래프와 시각화를 추가할 수 있다. 각 팀 구성원은 또한 개별 스토리에 대한 의견을 제시할 수 있다. 모든 데이터를 수집하면 작업물을 게시하고 확장된 실시간 대시보드로 사용하며 다른 사람들과 공유할 수 있다.

가격정책은 처리하는 데이터량과 스토리보드 작가의 수 등을 포함하여 연간 구독 모델에 기초하고 있다. 일반적인 기업 배치는 연간 약 5만 달러부터 시작한다.

한편 스토리를 이용해 대용량의 데이터를 처리하는 아이디어가 이번 스트라타 + 하둡 월드 컨퍼런스의 테마 중 하나다. 맵핑(Mapping) 스타트업 카르토DB(CartoDB)는 지도 상에 특정 지역 관련 데이터를 덧씌워 시각화하는 방법을 제공하고 있다. 스토리텔링은 이 서비스의 핵심이라고 카르토DB의 수석 공학자 앤드류 힐은 프레젠테이션을 통해 밝혔다.

힐은 "실제로 우리는 사람들이 통찰력을 얻고 자신의 데이터에 관한 이야기를 할 수 있도록 돕기 위해 노력하고 있다. 생각을 전달하거나 자신의 일의 중요성에 대해 사람들을 설득하고 싶을 때 스토리텔링은 필수적”이라고 말했다.

클리어스토리 데이터(ClearStory Data)에 투자한 기업으로는 안드레슨 호로비츠(Andreessen Horowitz), DAG 벤처스(DAG Ventures), 구글 벤처스(Google Ventures), 코슬라 벤처스(Kohsla Ventures), 클라이너 퍼킨스 오필드 & 바이어스(Kleiner Perkins Caufield & Byers) 등의 벤처 캐피탈 기업들이 포함돼 있다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.