Offcanvas

BI / 빅데이터 | 애널리틱스 / 애플리케이션

기고 | NoSQL의 '숨은 비용' 이야기

2016.01.07 Gary Orenstein  |  Network World


*쿼리 지연. 매우 복잡한 분석은 NoSQL 데이터스토어에는 매우 까다로운 과제가 될 수 있으며, 따라서 많은 기업들은 결과의 사전 산출을 강요 받게 된다. 탭조이(Tapjoy)는 H베이스(Hbase)의 사례에서 이런 문제를 포착했고, 샌프란시스코에서 치러진 인메모리 컴퓨팅 컨퍼런스 기간 중 진행된 그들의 ‘데이터 사이언스 플랫폼 구축을 꿈꾸는 히치하이커들을 위한 안내서’ 프레젠테이션 섹션에서 그들의 사례를 소개했다. 이 배치 프로세싱(batch processing) 워크플로는 시스템 지연을 야기했고, 데이터의 비즈니스 가치를 떨어뜨리는 원인이 되기도 했다. 배치 지향 워크플로에서 도출되는 결과물은 불가피하게 시각 차이를 내제하며, 실시간 분석을 제공하는 것이 불가능하다.

*하드웨어 확산. 확장, 특히 클러스터 내 노드 수를 확장하는 과정은 명예의 훈장이 될 수 있다. 그것의 목표는 얼마나 많은 수의 노드를 배치하는지가 아닌, 얼마나 적은 수의 노드를 배치하는지에 달린 문제다. 이보다 더 중요한 것은 각 노드들의 트랜잭션 효율성이다. NoSQL 솔루션에 추가적 SQL 레이어를 덧붙여야 하거나 쿼리 구동 전 사전 산출을 반드시 완료해야 하는 상황에서, 이는 하드웨어 확산, 그리고 결과적으로 비용 증대를 야기한다.

* 모델은 유지하고, 워크로드는 통합. 다른 옵션도 존재한다. 최근 가트너는 이것을 ‘아방-가르드 관계형 데이터베이스’라 부르기도 했는데, 대게 인메모리 테크놀로지를 통해 SQL의 관계형 특성을 활용한 솔루션을 제공한다. 이러한 아방가르드 데이터베이스들은 상당수가 JSON같은 데이터도 포함하고 있어 정형/비정형 데이터를 위한 데이터 모델도 제공한다.

오늘날 고객들도 NoSQL을 대체할 새롭고, 더 저렴한 솔루션처럼 보였던 것이 사실은 생각보다 더 많은 비용을 초래하는 솔루션이었음을 깨닫고 있다. 다행히도, 하나의 솔루션으로 포괄적 SQL 분석과 필요한 성능을 모두 충족시킬 수 있는 데이터베이스 덕분에 이러한 문제를 해결할 수 있게 됐지만 말이다.

빅데이터 업계도 기업들이 데이터를 수집하고 처리하는 방식에서 일대 혁명이 일어날 것임을 눈치채고 있다. 하지만 이러한 분위기는 무엇보다도 빅데이터 관련 저명한 대변인인 그웬 샤피라의 말로 가장 잘 요약될 수 있을 것이다.
 

“이 혁명에 스키마는 절대 빠지지 않을 것이다”
— 그웬 샤피라 (@gwenshap) 2015. 12. 03

이 트윗은 단 한 줄로 NoSQL과 관련된 변화를 잘 보여준다. 스키마 없는 데이터 관리 옵션이 마치 만병통치약처럼 보였지만, 현실은 이와는 꽤 대조적이었다. 오히려 많은 이들이 오랜 세월에 걸쳐 입증된 구조와 스키마, 그리고 SQL의 가치를 다시금 깨닫고 있기 때문이다.

*Gary Orenstein은 MemSQL의 CMO다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.