Offcanvas

BI / CIO / 빅데이터 | 애널리틱스

빅데이터와 잘 맞는 RDBMS '스플라이스 머신'... 이유는?

2015.11.30 Thor Olavsrud  |  CIO


SQL 데이터베이스 내 비정형 데이터 처리
스플라이스 머신 2.0의 아키텍처는 가상 테이블 인터페이스(VTI, Virtual Table Interface)를 이용해 외부 데이터베이스 및 파일 내 데이터의 연합 쿼리를 실행하는 기능도 포함하고 있다. 기계학습, 스트림 분석, 데이터 통합, 그래프 모델링용 모든 사전 구축 스파크 라이브러리들을 실행하는 기능도 새로운 버전이 지원하는 내용이다.
 
즉 이는 관계형 데이터베이스지만 VTI를 이용해 비정형 데이터를 처리할 수 있다는 것이다.

츠위벤은 “우리가 외부 데이터 유형에 쿼리를 적용하는 과정에서 해당 데이터의 정형/비정형 여부는 제약 요인이 아니다. 또 우리는 표준 하둡 인터페이스 역시 갖추고 있기 때문에 하둡 및 스파크 내 어떤 비정형 기능이라도 우리의 데이터베이스를 호출하고 이로부터 업무적으로 성숙한 데이터를 획득할 수 있으며, 이후 이를 업무적으로 일관된 방식으로 처리한 뒤 다시 반환하는 과정 역시 아무 문제없이 진행할 수 있다”라고 설명했다.

츠위벤은 “이를 통해 기업들은 이제 부작용 없이 NoSQL 데이터베이스가 제공하는 확장성의 이점을 누릴 수 있게 될 것”이라고 강조했다. 

그는 “수십 억 줄의 코드가 SQL로 쓰여져 있다. 기업들에게 이 코드들의 재작성을 요구하는 것은 미친 짓이다. 또 SQL은 분명 NoSQL 보다 강력한 방식이다. 30년간 누적된 SQL의 탄탄한 토대는 기업 애플리케이션을 설계하는 개발자들에게 값진 자양분이 된다. 기존의 모든 코드를 재작성하고 모든 인력을 재교육하는 것, 그리고 그 일련의 과정에 수백 만 달러를 지출하고 싶어하는 기업은 어디에도 없을 것이다”라고 말했다.

이들 기업은 현재 스플라이스 머신 2.0의 공개 베타를 실험할 애플리케이션들을 모집하고 있다. 츠위벤에 따르면, 스플라이스 머신 2.0의 정식 출시는 수 개월의 공개 베타 이후 2016년 상반기 중에 이뤄질 예정이다.  

베타 테스터는 혼합된 워크로드를 처리하는 기업들을 위주로 모집 중이며, 특히 실시간, 동시 요청이 전달돼 데이터의 지속적인 업데이트와 갱신이 필요하고 동일 데이터에 대한 다수 사용자의 동시 접근이 요구되는 업무 환경의 기업들에게 우선권이 주어진다. 베타 지원자는 정기 리포트나 추가 분석 등 데이터 상의 분석 작업을 빈번히 진행해야 한다는 조건도 충족해야 한다.

스플라이스 머신이 중점적으로 모집하는 활용 영역으로는 디지털 마케팅 애플리케이션, 금융 서비스 애플리케이션, 생명 과학 애플리케이션 등이 있다.
 
웰즈 파고(Wells Fargo)는 이미 스플라이스 머신 2.0와 베타 테스트 계약을 체결한 상태다.

웰즈 파고의 R&D 사업부 제스 룬드 대표는 11월 17일 성명서에서 “우리 금융 서비스 산업은 점점 더 다양하고 많은 데이터를 다루고 있다. 이 경향은 앞으로도 이어질 것이라 본다. 이 데이터들을 처리하기 위해 우리에겐 운영 업무와 분석 업무를 동시에 지원할 수 있는 새로운 아키텍처가 반드시 필요하다. 그런 측면에서 스플라이스 머신 2.0은 상당히 흥미로운 솔루션이고, 우리가 누구보다 먼저 이를 테스트해볼 수 있게 됐다는 점을 매우 기쁘게 생각한다”라고 이야기했다. ciokr@idg.co.kr
 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.