Offcanvas

빅데이터 | 애널리틱스 / 애플리케이션

드레미오, '빅데이터 부채 계산기' 무료 공개

2017.05.22 Thor Olavsrud  |  CIO
여러 기업이 디지털 혁신 이니셔티브를 진행하면서 '데이터 부채' 문제를 겪고 있다. 데이터 분석 스타트업 드레미오(Dremio)가 지난주 출시한 '빅데이터 부채 계산기'(Big Data Debt Calculator)는 바로 이 현상에 주목해 등장한 무료 도구다.

드레미오의 이번 계산기는 비 관계형 데이터 관리 기술을 사용함에 따라 발생할 수 있는 비용을 추정할 수 있게끔 돕는다.

기업들의 디지털 혁신 프로젝트는 비관계형 기술을 도입해 기업이 좀더 민첩하기 현업 이용자들에게 데이터 분석 결과를 제공하려는 시도를 담곤 한다. 이를 위해 SaaS 애플리케이션, 클라우드 데이터베이스, NoSQL 및 관련 기술을 수용해 차세대 활용 방안을 만들거나 제시하는 새로운 방법을 제공하려 한다. 그러나 이러한 시스템이 생산하는 비즈니스 데이터는 전통적인 분석 워크플로우 및 도구와 적절히 호환되지 않는다는 점이 문제다.

즉 새로운 애플리케이션과 활용 방안은 이에 걸맞는 새로운 도구를 필요로 하는 것이다.

드레미오의 CEO이자 공동 설립자인 도머 시란은 "모든 데이터는 수명 주기가 있다. 지금까지 데이터를 만들고 분석하는 도구, 이를 활용하는 기술은 거의 ​​40 년 동안 사용되어온 관계형 모델을 기반으로 하고 있다"라고 말했다.

그는 이어 "그러나 빅데이터 시대가 도래하자 현대적 데이터 구조를 지원하고 상시 연결된 사용자에게 전달할 수 있는 새로운 기술들이 탄생했다. 이러한 기술과 시스템들은 기존 분석 인프라와 근본적으로 호환되지 않는 데이터를 생성한다. 그래서 데이터 부채가 발생하게 된다"라고 덧붙였다.

드레미오의 빅데이터 부채 계산기는 이러한 부채를 피할 수 있도록 예측값을 내놓는다. 드레미오는 부채를 최소화하기 위한 권장 사항, 부채를 상환하고 허용 범위 내에서 유지하도록 돕는 전략을 제시한다고 설명했다. 계산기가 감안하는 4가지 요인은 다음과 같다.

- 하둡, NoSQL, 아마존 S3 및 여타 기업의 애플리케이션을 포함해 비관계형 시스템에 저장된 원본 데이터의 양 (테라 바이트 단위)

- 소스 시스템의 수 (서버가 아니라 하둡 클러스터 50 개가 하나의 시스템으로 계산 됨)

- 데이터를 사용하는 데이터 분석가의 수

- 데이터를 사용하는 데이터 과학자의 수

계산기는 이 밖에 2가지 요인을 추가적으로 검토한다.

- 책임 비용(Liability costs). 드레미오는 기존의 방식보다 성숙도가 낮은 도구와 프로토콜을 이용하기 때문에 책임 비용이 더 많이 발생한다고 설명했다. 책임 비용에는 분석가 및 데이터 과학자가 사용하는 도구와 호환되도록 파이프라인을 통해 이동하는 데이터로 인한 잠재적 손실이 포함된다.

- 기회 비용(Opportunity costs). 드레미오는 애플리케이션 데이터를 분석 환경으로 이동하는데 상당한 시간이 소요될 수 있으며, 이 시간을 줄이려면 큰 비용이 발생할 수 있다고 설명했다. 기회 비용에는 데이터가분석가 및 데이터 과학자가 사용하는 도구에 도달하기 위해 파이프 라인을 통해 이동하는 시간으로 인해 실현되지 못 하는 가치가 포함된다.

드레미오는 상기 요인 값을 감안해 계산기가 부채의 양을 추정해주기 때문에 기업이 대비할 수 있게 된다고 전했다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.