Offcanvas

BI / How To / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스 / 애플리케이션

네가 있어 웃는다··· '데이터 준비 도구' 따라잡기

2019.11.07 Thor Olavsrud  |  CIO


- 데이터 인제스트(Ingest) 및 프로파일링. 사용자가 인터랙티브한 방식으로 데이터 자산을 인제스트(흡수 또는 수집), 검색하고, 표본화하고, 준비할 수 있는 비주얼 환경이 있는지 검토해야 한다.

- 데이터 카탈로그화(분류) 및 기본 메타데이터 관리. 메타데이터를 생성하고 검색할 수 있는 도구를 선택해야 한다.

- 데이터 모델화 및 변환. 데이터 매쉬업과 블렌딩, 데이터 클린징, 필터링, 사용자 정의 연산, 그룹, 계층(구조)을 지원하는 도구를 선택해야 한다.

- 데이터 보안. 데이터 마스킹, 플랫폼 인증, 사용자와 그룹, 역할 기반 보안 필터링 등 보안 기능이 포함되어 있어야 한다.

- 기본 데이터 품질 및 거버넌스 지원. 데이터 준비 도구는 데이터 거버넌스와 관리, 데이터 품질 및 사용자 권한, 데이터 리니지를 지원하는 다른 도구들과 통합하는 기능을 제공해야 한다.

- 데이터 인리치먼트(강화). 엔티티(실체) 추출과 통합한 데이터에서 속성을 캡처하는 기능 등 기본적인 데이터 인리치먼트 기능들을 지원해야 한다.

- 사용자 협업과 운영화(조작화). 쿼리와 데이터세트 공유에 도움을 주는 기능이 있어야 한다. 여기에는 데이터세트 사용자 평가, 공식 워터마킹 등 거버넌스 기능, 공개 및 공유, 프로모션 모델이 포함된다.

자이디는 여기에 더해, 다음의 차별화된 기능을 고려해야 한다고 덧붙였다.

- 데이터 소스 액세스/연결. API와 표준 기반 연결성을 제공해야 한다. 인기 데이터베이스 PaaS와 클라우드 데이터 웨어하우스, 온프레미스 데이터 소스, 관계형 및 비구조화 데이터, 비관계형 데이터베이스 등 데이터 소스와 클라우드 애플리케이션에 대한 네이티브 액세스 기능이 여기에 포함된다.

- 머신러닝. 머신러닝 AI를 사용, 데이터 준비 프로세스를 강화하거나 자동화시키는 기능을 고려한다.

- 하이브리드 및 멀티 클라우드 배포 옵션. 데이터 준비 도구는 클라우드, 온프레미스, 하이브리드 통합 플랫폼 환경에 대한 배포를 지원해야 한다.

- 도메인, 또는 산업 특정적 서비스나 템플릿. 이런 도구는 데이터 준비 시간을 줄일 수 있는 도메인, 수직(분야) 특정적 데이터 모델에 대한 패키지 템플릿이나 서비스를 제공해야 한다.

자이디에 따르면, 첫 번째로 스탠드얼론 데이터 준비 도구를 선택할지, 아니면 데이터 준비 도구를 더 광범위한 분석/BI, 데이터 사이언스, 데이터 통합 도구로 제공하는 벤더를 선택할지 고려해야 한다. 

광범위한 분석/BI, 데이터 사이언스 도구의 데이터 통합에 의존하는 범용 유즈 케이스를 갖고 있다면 스탠드얼론 도구를 고려한다. 반면, 특정 플랫폼이나 생태계에 대한 데이터 준비가 필요하다면, 벤더 도구에 내장된 데이터 준비 기능을 선택하는 것이 더 합리적일 수 있다.

데이터 준비 도구 시장 현황
가트너는 데이터 준비 도구를 공급하는 벤더를 4개 범주로 구분하고 있다. 각 범주마다 벤더들이 많다. 데이터 준비 기능이 여러 다양한 데이터 관리 및 분석 도구에 탑재되고 있기 때문이다.

- 스탠드얼론 데이터 준비 도구들. 이 범주의 벤더들은 멀티 분석/BI, 데이터 사이언스, 데이터 통합 도구에 대한 지원, API 액세스 등 다운스트림 프로세스 통합을 강화하는데 초점을 맞춘다. 알테어(Altair), 데이터미어(Datameer), 로어 IO(Lore IO), 모닥 애널리틱스(Modak Analytics), 팍사타(Paxata) 같은 벤더가 이 범주의 도구를 공급하고 있다.

- 데이터 통합 도구. 이 범주의 벤더들은 전통적으로 데이터 통합 및 관리에 초점을 맞추고 있다. 캠브릿지 시맨틱스(Cambridge Semantics), 디노도(Denodo), 인포직스(Infogix), 인포매티카(Informatica), SAP, SAS, 탈렌드(Talend), TMM데이터(TMMData) 같은 벤더가 이 범주의 도구를 공급하고 있다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.