Offcanvas

데이터센터 / 비즈니스|경제 / 빅데이터 | 애널리틱스 / 신기술|미래 / 클라우드

고급 분석 분야에 부는 바람··· 11가지 핫 트렌드

2014.07.10 Thor Olavsrud  |  CIO




10. ETL에서 초래되는 도전을 회피할 수 있는 인-데이터베이스 분석
많은 데이터 세트를 대상으로 고급 분석을 실시할 경우, 성능과 데이터 거버넌스, 보안 상의 문제가 발생할 소지가 있다.

인-데이터베이스 분석은 사용자가 데이터를 분석 환경으로 옮기는 대신 데이터베이스에 모델을 배치하는 기능을 제공한다.

이를 통해 이런 문제점과 도전 가운데 상당수를 완화시킬 수 있으며, 데이터베이스에서 데이터 분석을 실시함에 따라 성능과 효율성이 높아지기도 한다. 또 보안과 데이터 거버넌스 문제도 줄어든다. 데이터가 안전한 데이터베이스 내부에 상주하기 때문이다.

카우프만과 키르쉬는 "하둡 등 여러 데이터 플랫폼에서 사용할 수 있는 인-데이터베이스 기능을 제공하는 벤더들이 많다. IBM, SAS, 래피드마이너, 레볼루션 애널리틱스, 스탯소프트, SAS, 안고스 등이 인-데이터베이스 마이닝을 지원하고 있다”라고 전했다.

그들은 이어 “단 인-데이터베이스 기능을 기준으로 벤더를 평가할 경우 회사가 사용하고 있는 데이터 플랫폼을 지원하고 있는지 조사하는 것이 아주 중요하다. 예를 들어, 하둡만 지원하는 벤더가 있는 반면 많이 사용하는 데이터 플랫폼을 거의 모두 지원하는 벤더들도 있다"라고 지적했다.



11. PMML로 발걸음을 돌리고 있는 기업들
모델의 정밀도를 계속 높이기 위해 배치 분석 대신 실시간 피드백을 활용하기 시작하면서, PMML(Predictive Model Markup Language) 을 이용하는 기업들이 증가하고 있는 추세다.

PMML은 벤더들로 구성된 독립 콘소시움인 DMG(Data Mining Group)이 개발한 통계 및 데이터 마이닝 모델 표준이다. IBM과 SAS는 DMG의 정회원이며, SAP와 스탯소프트, 래피드마이너, 안고스는 PMML 발전에 기여를 했다.

키르쉬에 따르면, 표준이 있을 경우 특정 애플리케이션과 시스템을 대상으로 개발된 모델을 다른 애플리케이션과 시스템으로 쉽게 이전해 배치할 수 있다.

카우프만과 키르쉬는 "이들 기업은 PMML에 기반을 둔 애플리케이션과 모델의 배치가 모델을 옮겨 생산화 하는 프로세스에 있어 지연 문제를 해결하고, 속도를 높이는 데 도움을 준다는 사실을 발견했다. PMML을 이용하는 가장 큰 장점 중의 하나는 많은 비용과 시간을 투자해야 하는 맞춤화 코딩 개발과 사유 프로세스(proprietary process, 사유기술을 조정하는 프로세스) 필요성을 없앤다는 것이다"라고 분석했다. ciokr@idg.co.kr

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.