Offcanvas

데이터센터 / 빅데이터 | 애널리틱스 / 애플리케이션

"데이터 웨어하우스도, 데이터 레이크도 아니다"··· SAP, 데이터 허브 솔루션 발표

2017.09.26 Peter Saye  |  IDG News Service
SAP가 데이터는 분산된 채로 남기고 처리만 중앙 집중화하도록 하는 개념의 솔루션 '데이터 허브'를 발표했다.

오늘날의 데이터 저장 방식은 크게 2가지다. 데이터 웨어하우가 정리정돈된 데이터를 저장하는 방식이라면 데이터 레이크는 마구잡이로 모든 데이터를 저장하는 방식이다. SAP의 새로운 데이터 허브는 새로운 절충형 방안에 해당한다.

새로운 데이터 관리 툴은 필요한 데이터만 처리하지도 모든 데이터를 한 곳으로 모으지도 않는다. 대신 원하는 곳에서 데이터를 찾을 수 있도록 한다. 데이터 과학자들은 이를 통해 여러 출처와 시스템의 데이터를 분석할 수 있게 된다.

SAP 데이터베이스 및 데이터 관리 분야의 글로벌 책임자 이르판 칸은 데이터 허브에 대해 "데이터 통합, 데이터 처리 및 데이터 거버넌스를 가능하게 하는 강력한 데이터 관리 우산 계층이다"라고 설명했다.

그는 이어 "소유하고있는 모든 데이터를 살펴보고 모든 정보에 접근할 수는 있지만,이 모든 데이터를 자체 데이터 호수에 집중시키는 것은 아니다. 데이터를 분산된 상태로 둔 채 모든 데이터를 캡처하고 정확히 접근할 수 있도록 한다"라고 말했다.

데이터 허브라는 개념은 종전에도 있었다. 그러나 SAP는 이 용어를 다소 다르게 사용한다. 맵R이나 클라우데라는 데이터 처리에 앞서 거대한 하둡 클러스터나 여타 중앙 저장소에 데이터를 집중시키는 개념으로 이용한다. 반면 SAP는 필요할 때까지 데이터를 현장에 남겨두는 개념이다.

SAP는 이를 위해 데이터 파이프라인이라는 개념을 생성했다. 데이터 파이프라인은 다른 파일 시스템 또는 APIs, 애널리틱스, 텐서플로우나 커스텀 코딩된 작업과 같은 머신러닝 라이브러리으로 이어지는 커넥터일 수 있다. SAP는 이를 위해 워크플로우 및 파이프라인 모델링을 위핸 그래픽 도구와 오케스트레이션 레이어를 제공하게 된다.

칸은 데이터 허브가 타사의 제품과도 통합될 수 있다고 말하면서 "SAP의 ETL 프로세싱을 반드시 필요로 하지 않는다. 인포매티카를 이용할 수도 있다"라고 말했다.

SAP 데이터 허브는 이미 출시된 상태다. 그렇다면 비용은 얼마나 들까? SAP는 여타 엔터프라이즈 소프트웨어와 마찬가지로 그때그때 다르다고 말했다.

SAP 대변인은 따르면 가격은 SAP 데이터 허브가 관리하는 전체 시스템 및 컴퓨팅 노드를 기준으로 책정된다. 또 SAP 인메모리 데이터베이스 엔진인 HANA 라이선스가 필요하다. 기존 HANA 라이선스를 보유한 고객의 경우 용량이 충분하다면 이를 이용할 수 있다. HANA 라이선스가 없는 기업은 데이터 허브 런타임 요구사항을 충족할 만큼의 HANA 용량만 구입할 수 있다고 회사 측은 전했다. ciokr@idg.co.kr 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.