Offcanvas

빅데이터 | 애널리틱스 / 오픈소스 / 클라우드

이제 데이터도 서비스로... 눈 여겨 볼 ‘DaaS’ 벤더 11곳

2022.04.18 Peter Wayner  |  CIO
데이터 기반 의사결정이나 디지털 서비스를 보완하고자 하지만 수중에 충분한 데이터가 없을 수 있는 기업들의 선택 폭이 넓어지고 있다. 

오늘날 대부분 비즈니스의 중심에는 ‘데이터 기반 의사결정’과 ‘디지털 서비스’가 있다. 따라서 기업들은 (이를 위해) 충분한 데이터를 확보해야 한다. 하지만 비즈니스에 도움이 될 수 있는 모든 데이터를 내부적인 수단으로만 쉽게 생성, 정리, 분석할 수 있는 건 아니다. 기업들이 사용할 수 있는 데이터를 (유료로) 제공하는 ‘서비스형 데이터(Data as a Service; DaaS)’ 업체들을 살펴봐야 할 이유다. 

누가 ‘서비스형 데이터(DaaS)’를 필요로 할까? 데이터를 원한다면 누구든지 필요하다. 때때로 DaaS 업체의 데이터는 (기업들의) 내부 작업 또는 자체 비즈니스 운영에서 나온다. 때로는 DaaS 업체가 수집한 외부 소스(대부분 오픈소스)에서 나오기도 한다. 이는 기업들이 자체적으로 처리할 수 없는 데이터 자산을 활용할 수 있도록 지원한다. 
 
ⓒGetty Images

DaaS 오퍼링은 지난 수십 년 동안 발전해 왔지만 최근 개발자들은 유연한 사용량 기반 가격 정책을 가진 클라우드 모델이 (벤더가) 수익을 창출하려는 데이터 소스와 기업들을 더 쉽게 연결하는 데 도움을 줄 수 있다는 사실을 깨달았다. 아울러 DaaS 업체들은 오류를 수정하거나 격차를 메워 기업들이 자체적으로 수집한 데이터 품질을 개선하고, 더 많이 필요하다면 더 많은 데이터를 제공할 수도 있게 됐다. 이러한 방식을 통해 DaaS 업체들은 자체 개발한 데이터웨어하우스를 선별된 다른 소스와 교차 수정하여 개선할 수 있다. 

이 분야는 빠르게 성장하고 있다. 몇몇 DaaS 업체는 정보 관리, 데이터 분석, 보고서 작성, 의사결정 지원 등의 기능을 강조한다. 데이터가 너무 많으면 과잉 또는 과부족이라는 점에서 데이터 자체를 강조하는 업체도 있다. 많은 도구는 개발을 간소화하고 스마트하게 만드는 방식을 따르고 있다. 로우코드 및 노코드 옵션 덕분에 개발자와 끝없는 회의를 할 필요 없이 누구나 버튼 몇 개만 클릭하면 보고서를 생성하거나 데이터가 포함된 스프레드시트를 다운로드할 수 있다. 여기서는 기업들의 DaaS 니즈를 충족하는 데 도움을 줄 만한 다양한 옵션을 소개한다.

클라우드 업체
모든 주요 클라우드 업체는 자사 고객들을 위한 대규모 개방형 데이터세트를 보유하고 있다. 대부분 이 데이터는 무료이며, 로컬 컴퓨팅 서비스를 사용하도록 하는 인센티브로 제공되고 있다. 일반적으로 데이터는 이미 변환돼 있으며, 때로는 코드와 쉽게 통합할 수 있도록 로컬 형식으로 변환돼 있기도 하다. 예를 들면 애저 오픈 데이터세트(Azure Open Datasets)에는 인구 조사 데이터, 범죄 데이터뿐만 아니라 전 세계 기후 변화를 이해하는 데 초점을 맞춘 일부 데이터세트가 포함돼 있다. AWS 오픈 데이터(Open Data)에는 다양한 게놈 데이터와 500억 개의 웹페이지 모음인 커먼 크롤(Common Crawl)이 있다. 구글 클라우드의 데이터세트(Datasets)에는 특허, 날씨 정보 그리고 검색 및 웹 분석을 추적해 생성된 구글의 자체 데이터가 있다.

신용기관
3대 주요 기업(익스페리언(Experian), 트랜스유니언(TransUnion), 에퀴팩스(Equifax))은 미래에 얼마나 신뢰할 수 있는지 측정하기 위한 목적으로 점수를 계산하기 위해 모든 사람이 돈을 빌리고 상환하는 방식을 추적한다. 과거에는 점수 자체가 다소 이해하기 힘들고 숨겨져 있었지만 최근 은행 및 카드사는 고객들과 직접 점수를 공유하고 있다.

신용기관 자체는 대출기관하고만 협력하는 데 만족하지 않는다. 이를테면 에퀴팩스는 인력 관리, 사기, 신원 도용, 마케팅 등 더 큰 문제를 해결하고 싶어 한다. 사람들의 수입과 지출, 대출 상환 방식 등을 알면 의료, 자동차, 제조, 소매 등 여러 산업에서 다양한 질문을 예측하는 데 유용할 수 있다. 이제 신용기관들은 답변을 제공하는 새로운 방법을 모색하고 있다. 예를 들면 ‘에퀴팩스 이그나이트(Equifax Ignite)’는 민감한 개인정보가 에퀴팩스의 컴퓨터에서 벗어나지 않은 채 에퀴팩스의 데이터를 분석할 수 있는 클라우드 기반 도구다. 이는 여러 보안 및 컴플라이언스 계층에서 정교한 분석을 생성한다.

에니그마(Enigma)
전 세계 모든 소규모 비즈니스의 성장과 발전을 추적하는 일은 쉽지 않다. 에니그마는 다양한 정부기관 및 오픈소스에서 정보를 수집한 후 신용카드와 직불카드 은행이 제공하는 익명화된 거래 세부 정보를 혼합한다. 현금 흐름을 파악하는 것은 비즈니스의 본질을 이해하는 가장 빠른 방법이다.

HIR인포테크(HIRinfotech)
필요한 대부분의 정보가 이미 웹 사이트에서 제공되고 있는 경우가 많다. HIR인포테크는 이를 데이터베이스로 긁어모은 다음 분석하는 데 특화돼 있다. 이 회사는 여행 및 금융 서비스 등 여러 산업의 가격과 제품 데이터를 수집한다. 기업들은 이 데이터와 보고서를 가지고 작업하거나 수집된 정보와 통합된 RPA 도구를 사용할 수도 있다. 

인포매티카(Informatica)
클린한 최신 연락처 정보가 필요한 마케팅팀은 인포매티카를 통해 연락처 목록을 정리하고 업데이트할 수 있다. 이 회사의 서비스는 검증과 강화가 결합돼 있다. 우선, 주소와 전화번호는 주소 데이터베이스와 NDNC(National Do-Not-Call) 데이터베이스를 통해 이중으로 확인된다. 그다음 신뢰할 수 있는 기업 및 소비자 출처에서 얻은 세부 정보를 추가하여 연락처 자료를 구성한다.

오라클 DaaS(Oracle DaaS)
커뮤니케이션 라인을 열 수 있는 세일즈 인텔리전스와 기회에 목마른 마케터는 오라클 DaaS 제품의 주된 타깃이다. 이 DaaS 데이터베이스는 다양한 기업의 기본 및 보조 연락처 최신 정보를 유지관리한다. 롤로덱스(Rolodex; 회전식 명함 정리기)를 최신 상태로 유지하느라 고군분투하는 대신, 이 도구를 사용하면 새롭게 업데이트된 이름과 연락처를 소프트웨어로 가져올 수 있다. 엘로코아(Eloqua) 등의 다른 오라클 도구를 사용한다면 가져오기 경로가 이미 디버깅돼 있다.

프라사이즐리(Precisely)
지도상 위치와 그곳에 사는 사람들 정보가 필요한 개발자들은 프리사이즐리를 사용하고 있다. 예를 들면 ‘데모그래픽 API(Demographics API)’는 주소 또는 위치를 가져와 검색 반경 내의 사람과 가구에 관한 통계자료를 반환한다. 주거용 및 상업용 부동산 구획은 ‘프로퍼티 API(Property API)’를 통해 추적한다. 이 데이터는 기업들의 부동산 거래, 매장 위치 계획 또는 데이터베이스 기반의 자동 검색으로 정확한 주소를 찾아 온라인 소매점의 체크아웃 프로세스를 간소화하는 작업 등에 사용되고 있다. 아울러 이 회사는 애널리틱스 구축을 간소화하기 위해 데이터 처리 도구를 연결하고 있다.

RTI
美 인구조사국은 미국인의 개인정보를 보호하기 위해 (인구조사의 개인정보를) 72년 동안 공개하지 않는다. 이는 데이터 분석을 위해 기다리기엔 너무 긴 시간일 수 있다. RTI는 다른 접근방식을 취했다. 개인화된 정보를 제공하는 대신 실제 데이터를 모방하는 합성 데이터세트를 만들었다. 실제 인구조사 시 한 블록에 58명이 있는 경우 합성 데이터세트에서도 실제 값에 근접하도록 구성된 세부 정보와 58개에 가까운 항목을 확인할 수 있다. 인구조사 데이터를 분석하려는 기업들은 개인정보를 걱정하지 않고 알고리즘을 실행할 수 있다. 물론 답변이 실제 답변과 다를 수 있지만 충분히 유사한 답변이 제공된다. 아무렴 72년을 기다리는 것보단 낫다.

스노우플레이크(Snowflake)
데이터를 보유한 기업들이 자체 인프라를 구축하는 대신 스노우플레이크를 사용하여 데이터를 저장하고 분석하고 있다. 이 회사는 구조화 및 반구조화 데이터를 수집한 후 다양한 표준 보고 및 AI 서비스를 제공하는 옵션을 제공한다(이는 유지관리가 필요 없으며 확장 가능하다). 아울러 ‘데이터 마켓플레이스(Data Marketplace)’를 통해 사용자가 데이터를 사고팔 수 있게 하여 교차 수정으로 인사이트 품질을 개선할 수 있도록 지원한다. 주요 데이터세트에는 MSCI 또는 S&P 글로벌(S&P Global)의 시장 조사와 노마(Knoema) 또는 스타스키마(Starschema)의 코로나19 역학 데이터 등이 있다. 인구통계 연구부터 마케팅, 미디어, 스포츠(판타지 축구 포함)까지 다양한 주제에 관한 광범위한 데이터가 존재한다.

스트리트라이트 데이터(Streetlight Data)
도시 계획 및 교통망 설계와 관련된 기업들은 사람들이 도로에서 무엇을 하는지 이해해야 한다. 스트리트라이트 데이터는 익명의 스마트폰 기록과 정부 출처를 사용하여 모든 사람을 추적하고, 사람들이 도심에서 이동하는 시기에 관한 상세한 모델을 구축한다. 스트리트라이트 데이터를 통해 기업들은 자체 센서 네트워크를 구축할 필요 없이 사람들의 흐름을 정확하게 측정할 수 있다. 

신세시스 AI(Synthesis AI)
일반적으로 DaaS 업체들은 실제 현실 정보를 수집한다. 하지만 신세시스 AI는 비디오 게임 및 할리우드 액션 영화에 사용되는 3D 모델과 CGI 기술을 사용하여 데이터를 생성한다. 만약 자율주행차를 개발하기 위해 머신비전 루틴을 학습시키고 싶다면 (이 회사에서) 필요한 만큼 테스트 케이스를 찾을 수 있다. 합성 데이터는 그 어떤 것보다 빠르고 더욱 포괄적이다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.