데이터 리터러시를 모든 직원에게!··· 셀프 서비스 BI·애널리틱스 툴 12선

Computerworld UK

기업 내 가용 데이터에 실시간 액세스 하기 원하는 사용자가 늘고 있다. 그리고 이로 인해 기업 내 현업 사용자도 사용할 수 있는 데이터 시각화 및 분석 도구를 전문 개발하는 기업들이 ‘호황’을 맞고 있다. IT가 며칠을 소비해 보고서를 생성하고, 몇 주를 투자해 엑셀을 만들던 시대는 저물었다.

가트너는 글로벌 BI(비즈니스 인텔리전스) 분석 소프트웨어 시장이 2020년에는 228억 달러의 시장으로 성장할 것으로 내다보고 있다. 가트너는 최근 발표한 보고서에서 “데이터 발견 및 다양한 구조의 데이터에 대한 액세스, 데이터 준비 도구 및 스마트 기술이 부상하면서 분석이 보편화되고, 거버넌스 부담이 완화될 전망”이라고 분석했다.

엔터프라이즈 고객들이 가장 많이 사용하고 있는 마이크로소프트 파워 BI, SAP, 오라클, IBM을 제외하고, 가장 높은 평가를 받는 분석 및 BI 플랫폼을 소개한다. C급 경영진부터 소셜 미디어 관리자, 데이터 사이언티스트까지 다양한 사용자가 활용할 수 있는 ‘셀프 서비스’ 도구들이다.

1. 테라데이타 애널리틱스 플랫폼(Teradata Analytics Platform)
2. 태블로(Tableau)
3. 클릭(Qlik)
4. SAS
5. 도모(Domo)
6. 스플렁크(Splunk)
7. 트릴리움(Trillium)
8. 로지 애널리틱스(Logi Analytics)
9. 크림슨 헥사곤(Crimson Hexagon)
10. 알터릭스(Alteryx)
11. 팁코(Tibco)
12. 드리븐BI(DrivenBI)





1. 테라데이타 애널리틱스 플랫폼(Teradata Analytics Platform)
테라데이타 애널리틱스 플랫폼(Teradata Analytics Platform)은 2017년 10월, 테라데이타의 파트너 대상 컨퍼런스에서 공개됐다. 다양한 시스템을 하나의 환경으로 통합한 플랫폼이다. 동일 생태계에서 다양한 데이터 형식과 언어를 지원한다. 또한 사용자가 인터페이스와 도구를 바꿔 사용할 수 있어, 데이터 분석 방법을 자유롭게 선택할 수 있다는 장점이 있다.

초기에는 테라데이타와 애스터(Aster) 기술을 통합할 예정이지만 추후 아파치 스파크(Apache Spark)와 머신러닝 프레임워크인 텐서플로우(TensorFlow) 같은 오픈소스 엔진을 옵션으로 추가할 계획이다. 분석을 플랫폼에 직접 연결해 공급하는 방법으로 수행하기에 여러 엔진에 데이터를 저장할 필요도 없다. 기업에 다양한 분석 기술이 보급되면서 ‘사일로’가 형성되는 문제를 해결하기 위해 개발된 플랫폼이다.

테라데이타는 이질적인 데이터, 도구, 언어를 하나의 완전한 분석 서비스로 통합한다는 전략을 추진하고 있으며, 이의 일환으로 이런 플랫폼을 탄생시켰다.

2. 태블로(Tableau)
태블로(Tableau)는 데이터 시각화에 초점을 맞춘 셀프 서비스 분석 플랫폼이다. 기업에서 파워포인트 프레젠테이션을 없애는 역할을 할 수 있다. 이 회사는 색상, 애니메이션, 지도 전문가를 확보해, 쉽게 이해할 수 있는 데이터 시각 기술을 구현하고 있다.

고객들은 온라인 서비스, 또는 온프레미스 태블로 서버를 이용할 수 있다. 태블로는 엑셀(Excel) 같은 기존 데이터 소스부터 아마존 오로라(Amazon Aurora), 마이크로소프트 애저 SQL, 데이터 웨어하우스(Data Warehouse), 맥용 맵R 하둡 하이브 커넥티비티 같은 최신 데이터 소스까지 다양한 데이터 소스와 연결된다.

아주 빨리 구현할 수 있는 특징을 지니고 있으며 시각화가 비주얼 승인 권한, 거버넌스 같은 관리자 도구까지 확대되어 있다.

태블로 EMEA의 책임자인 제임스 엘리오아트는 컴퓨터월드 UK와 가진 인터뷰에서 “우리는 기술적 배경이 없는 사람을 포함해 모든 사람이 코드나 프로그래밍 없이도 데이터를 사용할 수 있어야 한다고 믿는다. 기술적인 트레이닝이 필요 없어야 한다”라고 강조했다.

한편 태블로는 2017년 2월 모든 요금제를 ‘월 구독 요금제’로 변경했다. 태블로 데스크톱 퍼스널과 태블로 데스크톱 프로페셔널의 사용자 당 월요금은 각각 35달러 및 70달러선이다. 온프레미스나 퍼블릭 클라우드 기반의 태블로 서버는 사용자 당 약 월 35달러, 완전히 호스팅된 태블로 온라인은 약 42달러다.

3. 클릭(Qlik)
클릭(Qlik)은 데이터 시각화, BI, 분석 분야에서 평판이 높다. 이 회사는 다양한 라인업을 공급하고 있다. 셀프 서비스 솔루션인 클릭 센스(Qlik Sense), 첫 번째 가이드형 분석 제품인 클릭 뷰(Qlik View ; 스플렁크와 유사), 가이드 및 임베디드형 분석 제품인 클릭 애널리틱스 플랫폼(Qlik Analytics Platform), 클릭 데이터마켓(Qlik DataMarket)이라는 외부 데이터 피드로 구성돼 있다.

셀프 서비스 도구인 센스는 당연히 직관적인 시각화 도구이다. ‘드랙 앤 드롭’ 입력 방식이 구현되어 있다. SQL 쿼리나 스크립팅이 필요 없다. 사용자는 검색 기능을 이용, 중요 매트릭스를 추적할 수 있다. 센스는 중앙 거버넌스와 보안 기능이 탑재된 엔터프라이즈급 제품이다. API를 통해 데이터 소스를 맞춤화 할 수 있는 플랫폼이다.

클릭 센스는 구독 라이선스 모델에 토대를 둔 요금제를 채택하고 있다. 요금에 대한 자세한 정보는 클릭 영업팀에 직접 문의한다.

4. SAS
분석 소프트웨어 개발사인 SAS 또한 비주얼 애널리틱스(Visual Analytics)라는 셀프 서비스 솔루션을 공급하고 있다. 클릭 및 스플렁크와 유사하게, 사용자 친화적이면서 강력한 인-메모리 플랫폼이다. 하둡(Hadoop) 등 다양한 데이터 소스를 연결할 수 있다.

기업 사용자들은 인터랙티브 보고서를 생성, 웹이나 모바일 애플리케이션을 통해 공유하거나, SAS 오피스 애널리틱스를 사용해 마이크로소프트 애플리케이션에 직접 통합시킬 수 있다.

SAS의 큰 장점 중 하나는 SAS 클라우드 등 다양한 분석 제품을 통해 다양한 애드온을 활용할 수 있다는 것이다. 또 기존 하드웨어나 데이터베이스에 구현할 수도 있다. 클라우드에 있는 것들도 상관 없다.

SAS는 경쟁 제품처럼 엔터프라이즈급 기능들을 ‘광고’하지 않는다. 그러나 중앙 IT 관리 도구와 데이터 거버넌스를 위한 사용자 인증 기능을 기본 제공한다. 엔터프라이즈급 솔루션의 가격은 ‘맞춤형’이다. 따라서 SAS 영업팀에 직접 문의해야 한다.

5. 도모(Domo)
2009년 자신이 설립한 웹 분석 회사인 옴니츄어(Omniture)를 어도비에 18억 달러에 매각한 조쉬 제임스가 설립한 기업인 도모는 BI 및 데이터 시각화에 초점을 맞추고 있다.

도모(Domo)는 통합 기능을 기본 제공한다. 모든 데이터 소스를 플랫폼에 연결하는 기능, SQL 코딩 방법을 몰라도 분석할 데이터를 준비할 수 있는 기능을 제공해 번거로운 데이터 클린징 프로세스를 없애는 방법으로 진짜 셀프 서비스 BI를 구현하려는 시도를 하고 있다. 이후 정기적인 보고서를 자동 생성하고, 전사적으로 이를 공유해 협업을 할 수 있다.

도모 클라우드 버전은 5명까지 무료다. 이후 스탠다드 제품은 사용자 당 월 83달러, 사용자 수에 제한이 없고 2억 5,000만 데이터 열을 제공하는 제품은 160달러다. 전문 지원 서비스를 제공하고 20억 데이터 열을 사용할 수 있는 엔터프라이즈 제품은 190달러다. 


6. 스플렁크(Splunk)
하둡용 스플렁크 애널리틱스는 스플렁크 엔터프라이즈의 핵심 기능을 통합, 하둡 환경에서 데이터를 조사, 분석, 시각화 할 수 있다. 사용자는 차트와 그래프, 대시보드를 생성해 공유하고, 동일한 스플렁크 엔터프라이즈 인터페이스를 이용해 결과를 미리보기 하고, 검색을 조정하면서 로우 데이터를 쿼리할 수 있다. 또한 역할 기반 액세스 제어 및 HDFS 패스스루 인증을 통해 보안을 지원한다.

스플렁크는 엔터프라이즈급 가이드형 분석 플랫폼을 공급하고 있다. 가격은 월 150달러부터다. 클라우드 분석 솔루션의 경우, 매일 5GB, 총 용량 450GB 기준으로 월 810달러다. 또한 라이트(Light)라는 자동 SaaS 솔루션은 월 75달러부터 시작된다.

하둡용 스플렁크 애널리틱스 라이선스 요금은 스플렁크 영업팀에 직접 문의한다.

7. 트릴리움(Trillium)
계속 증가하는 데이터 소스를 자체 분석하는 경우, 데이터 품질이 점차 더 중요해진다. IT는 비즈니스 사용자에게 제공할 데이터를 병합하고 정리하는 일에 몇 개월을 투자해야 할 수도 있다. 트릴리움은 이런 프로세스를 30일 이하로 줄여줄 수 있는 솔루션이다.

트릴리움(Trillium)은 데이터 품질 관리용 제품 2종을 공급하고 있다. 리파인(Refine)과 프리페어(Prepare)라는 제품들이다. 두 제품 모두 이질적인 데이터 소스를 연결하고, 일관된 인덱스 아래 하둡 환경의 단일 저장소로 통합하는 방법으로 데이터 준비 작업을 도와준다.

리파인의 경우 한 걸음 더 나아간다. 상충되거나 불완전한 데이터를 병합하거나 제거해 클린 데이터 세트를 제공한다. 이런 데이터를 트릴리움과 제휴 관계인 태블로나 클릭 뷰 같은 시각화 플랫폼에 공급해 인사이트를 추출할 수 있다.

트릴리움의 빅데이터 제품 관리 담당 VP인 에드 레이젠은 컴퓨터월드 UK에 “강력한 민첩성을 추구하는 사용자들이 있다. 이들은 대형 인프라를 원하지 않는다. 시장에 더 빨리 도달할 수 있도록 돕는 기술을 원한다”라고 말했다. 레이젠에 따르면, 대형 벤더에서 이를 추구할 경우 서로 연결해야 할 수 많은 도구들을 필요로 하게 된다.

트릴리움은 유연한 구독 요금제를 채택하고 있다. 하둡 노드가 측정하는 데이터의 양에 토대를 둔 요금제이다. 진입점(시작 가격)은 아주 낮으며, 필요에 따라 확장할 수 있는 장점이 있다.

8. 로지 애널리틱스(Logi Analytics)
로지 애널리틱스(Logi Analytics)는 애플리케이션 개발 플랫폼으로 출발했지만, 셀프 서비스 분석 및 데이터 시각화 플랫폼으로 진화했다.

회사의 EMEA VP인 톰 케이힐은 컴퓨터월드 UK에 “보고 라이브러리, 규칙 엔진, 보고서 통합 도구가 아니다. 개발 환경이다. 접근성이 아주 높고 우수하다는 의미다. 스탠드얼론 키트나 아키텍처를 조합한 형태가 아닌 개발자 키트이기 때문이다. 대기업과 소프트웨어 산업이 관심을 가질 기술이다. 무언가를 개발한 후, 이를 애플리케이션에 집어 넣어 판매하는 회사들이 특히 그렇다”라고 설명했다.

로지는 100% 맞춤화가 가능한 프론트 엔드 기술을 제공한다. 또한 셀프 서비스 데이터 분석 및 시각화를 위한 트레이닝을 지원한다. 이후에 고객 지원을 받을 수 있다.

케이힐은 “로지를 설치하면 기업이 승인한 인프라에 위치한다. 아주 자연스럽고, 보안 인프라에 부합되는 형태이다. 또한 로지를 자유롭게 구성할 수 있다. 전문성이 부족해도 셋업을 할 수 있다. 그 이면에는 종합적으로 연결되어 있는 요소들, 맞춤화가 가능한 대시보드가 존재한다”라고 설명했다.

요금은 로지에 문의해야 한다. 사용자, 필요한 기능, 서버 수, 코어 등 여러 요소가 요금을 결정한다. 또한 영구 라이선스와 연간 라이선스로 나눠져 있다.

9. 크림슨 헥사곤(Crimson Hexagon)
크림슨 헥사곤은 주로 대기업 고객들을 필요로 하는 셀프 서비스 소셜 미디어 분석 기술을 판매하고 있다. 

시각화의 경우, 크림슨 헥사곤은 티커(Tickr) 같은 도구를 연결해 실시간 단일 대시보드를 제공한다. 이 대시보드에서 해당 브랜드의 모든 접점에서 발생하는 트렌드와 정서(sentiment)를 확인할 수 있다. 소셜 데이터와 검색 트렌드, 웹 분석을 통합한 것 또한 특징이다. 

크림슨은 텀블러(Tumblr) 같은 플랫폼의 분석을 지원하고 있다. 또한 런던의 위치가 태깅되지 않은 채 플랫폼에 게시된 사진 등의 데이터를 활용하기 위한 이미지 분석에 투자하고 있다.

크림슨 헥사곤은 일명 ‘모니터’ 요금제를 적용하고 있다. 분석 대상이 요금 책정 기준이다. 가장 규모가 작은 패키지는 20 ‘모니터’이다. 캠페인이 끝나면 이를 교체해 사용할 수도 있다.

10. 알터릭스(Alteryx)
알터릭스는 비즈니스 애널리스트를 위한 분석 플랫폼이다. 데이터와 인사이트를 분석, 빠르게 보고서를 생성해 전달할 수 있다.

주요 도구는 디자이너(Designer)다. 공간 데이터 등 다양한 데이터 소스의 데이터를 준비, 혼합, 분석하는 기능이 통합된 툴킷이다. 즉 워크플로를 단순화 시킨 것이 특징이다. 

또한 코딩 능력이 없는 애널리스트도 ‘드랙 앤 드롭’ 도구로 R 기반 예측 분석 기능을 이용할 수 있다. 아주 간편한 보고서 생성 도구이다. 이후 보고서를 마이크로소프트 엑셀, ESRI, XML, PDF, 태블롯, 클릭 등 다양한 형식과 플랫폼으로 내보낼 수 있다.

알터릭스는 또 서버(Server)로 불리는 공유와 협업용 온프레미스 솔루션, 분석 애플리케이션 배포에 초점이 맞춰진 클라우드 기반 제품인 애널리틱스 갤러리(Analytics Gallery)도 공급하고 있다.

알터릭스 디자이너는 3년 구독 시 사용자 당 약 4,200달러의 연 이용 요금이 책정된다. 1년 구독 시에는 약 5,500달러다. 공간 데이터 및 데스크톱 자동화 기능을 애드온으로 지원한다.

11. 팁코(Tibco)
팁코(Tibco)는 엔터프라이즈 고객들을 대상으로 셀프 서비스 분석 플랫폼인 스폿파이어(Sporfire)를 제공하고 있다. ‘플랫폼’(Platform)이라는 제품을 통해 이용할 수 있다.

스폿파이어는 기업 곳곳에서 데이터를 수집 및 통합, 단일 통합 플랫폼에서 역사적 데이터, 실시간 데이터를 제공하는 기능을 갖추고 있다. 이런 데이터를 다양한 형태로 세분화 및 분석할 수 있다. 인터랙티브 시각화, 진단 분석, 데이터 보강, 예측 분석, 위치 기반 인사이트 등을 예로 들 수 있다.

보통 사용자를 위해, 스폿파이어는 비즈니스 정보를 다룰 때 적절한 방향을 알려주는 ‘베스트 프랙티스’ 추천 기능을 내장하고 있다. 소규모 팀을 대상으로 하는 스폿파이어 데스크톱 및 클라우드의 경우, ‘플랫폼’과 함께 중앙 거버넌스 플랫폼, 엔터프라이즈급 데이터 보호 및 컴플라이언스 기능이 제공된다.
팁코 플랫폼 가격은 요구 사항에 따라 다르며, 직접 문의해야 한다.

12. 드리븐BI(DrivenBI)
실리콘 밸리에 소재한 BI 소프트웨어 개발사인 드리븐BI(DrivenBI)의 플래그십 제품인 SRK는 IT 전문성이 없이도 사용할 수 있도록 만들어져 있다. 회사의 글로벌 영업 책임자인 캐더린 더글라스(Kathleen Douglas)는 “데이터 모델링, 웨어하우스, 프로그래밍, ETL이 필요 없다”라고 강조했다.

SRK는 다양한 제네릭 및 맞춤형 커넥터를 통해, 오라클 데이터베이스, 로컬 파일 저장소, 세일즈포스 같은 웹 서비스 등 다양한 데이터 소스의 데이터를 대시보드로 통합할 수 있다. 이 과정에서 상세히 액세스를 제어할 수 있는 것이 특징이다. 영업 책임자가 보고서를 생성하는 경우, 나머지 팀원들은 제한된 권한으로 특정 클라이언트와 관련된 데이터만 확인할 수 있다는 의미다. 

드리븐BI SRK 소프트웨어는 구독형 라이선스 요금제를 채택하고 있다. 요구사항에 따라 가격이 달라지며, 직접 문의해야 한다. 퍼블릭 클라우드, 또는 프라이빗 클라우드에 배포할 수 있다. 드리븐BI는 현재 약 400여 곳의 고객사를 확보하고 있다. ciokr@idg.co.kr