Offcanvas

How To / 디지털 트랜스포메이션 / 빅데이터 | 애널리틱스

막무가내 도전은 곤란··· 예측 애널리틱스 도입 원칙 7가지

2018.07.12 John Edwards  |  CIO


프라이버시와 관련된 규정을 위반하지 않는 가장 간단한 방법은 필요한 최소한의 기간만 데이터를 유지하는 것이다. 크로스비는 “수명이 짧은 데이터에서 가치가 높은 인사이트를 도출한 후 재빨리 이를 폐기하면 로우 데이터 프라이버시 문제를 방지할 수 있다”라고 설명했다.

5. 유용성을 극대화한다
처음부터 이해하기 쉬운 결과를 생성하는 종합적이고 복합적인 모델을 구현했을 때 예측 애널리틱스 기술의 효과가 가장 높다. 그러나 이렇게 하지 못하는 경우가 많다. 데이터 사이언티스트만 정확히 해석할 수 있는 복잡하고 불가해한 결과와 씨름하게 되는 경우가 많다. 동시에 이해 당사자들에게 제공하는 가치가 거의 없는 미흡하고 지나치게 단순한 해석을 제공하는 경우도 많다.

유용성을 극대화하기 위해서는 최종 사용자를 염두에 두고 사용자 인터페이스를 구현해 배포해야 한다. 헬스케어 분야를 대상으로 예측 애널리틱스 및 머신 학습 기술을 제공하는 회사인 린타스(LeanTaaS)를 창업한 모한 지리드하라다스 CEO는 “기반이 되는 모델이 아주 정교해도, 사용자 인터페이스는 단순하게 구현할 수 있다”라고 말했다.

이와 관련, 구글의 웹 검색이나 애플의 아이패드를 참고할 만하다. 지리드하라다스는 “이런 제품의 사용자 환경(경험)은 누구나 사용할 수 있을 정도로 사용자 친화적이다. 그러나 안에는 복잡한 소프트웨어 및 하드웨어가 구현되어 있다”라고 설명했다.

어도비 애널리틱스 클라우드(Adobe Analytics Clod)의 그룹 제품 매니저인 벤 게인스는 예측 애널리틱스의 경우 ‘반복(Iterative)’이 중요하다고 강조했다. 모델을 런칭한 즉시 이런 사실이 명백해진다. 게인스는 “그 즉시 모델이 얼마나 잘 작동을 했는지 여부, 더 정확하고 실용성 높은 인사이트를 얻기 위해 이를 재조정할 수 있는지 보게 된다”라고 말했다.

예를 들어, 예측 애널리틱스는 기업이 트렌드(추세)를 예상할 수 있도록 도와준다. 장치의 트래픽을 예상하고, 사용자가 페이지당 임프레션(광고 노출 횟수)를 예상하고, 예상 매출을 기준으로 예산과 목표를 수립할 수 있다.

그는 “진짜 임프레션, 이를 통해 예산과 목표를 조정하는 방법을 파악하면 이를 출발점으로 세밀하게 모델을 조정 및 최적화할 수 있다. 처음부터 완벽하게 예측 애널리틱스 프로그램을 운영할 수 없다는 점을 인식해야 한다. 오류나 실수가 불가피하다. 그러나 이는 데이터 및 모델에 대한 이해를 높이도록 도움을 준다”라고 말했다.

6. 비용을 관리한다
온라인 대출 회사인 말레트 펀딩(Marlette Funding)의 아놀드 프라비나타 CDSO(Chief Decision Science Officer)에 따르면, 대부분의 데이터 분석 예산에서 가장 큰 비중을 차지하는 항목 두 가지는 데이터 획득 비용 및 급여이다.

이 중 데이터 비용에 유의해야 한다. 데이터 비용을 관리하기 위해 유용성이 없거나 미흡한 데이터에 돈을 낭비하고 있는지 정기적으로 확인해야 한다. 그는 “인건비는 통상 ‘시장 법칙’을 따라야 한다”라고 덧붙였다.

보관한 데이터의 양이 증가하면서 스토리지(저장소) 관련 비용이 급증할 수 있다. 설리반은 데이터를 중앙화하고, 체계적인 거버넌스 전략을 적용하는 방법이 비용 관리에 효과적이라고 주장했다. 그는 “몇 년 뒤면 예측 애널리틱스 유지관리를 자동화하는 방법을 이야기하게 될 것이다. 그러나 지금 당장은 통제 및 관리에 의지해야 한다”라고 설명했다.

7. 도구 선택에 유의한다
예측 애널리틱스 시장이 급속도로 확대되고 있다. 새로운 도입자들이 수 많은 플랫폼과 도구를 놓고 고민해야 한다는 의미다. 이와 관련, 내부에서 현명하게 선택을 할 수 있는 인재를 보유한 기업은 극소수이다. 이런 ‘스킬’ 양성에는 돈과 시간이 필요하다. 대부분은 예측 애널리틱스에 대한 계획을 발전시킬 때 외부에서 도움을 구할 수밖에 없다.

이 경우, 추천 상품과 서비스를 자세히 검토하고, 조직의 장기 계획에 부합할지 여부를 고려하는 것이 중요하다. 크로스비는 “특정 분석 알고리즘이나 학습 스택에 ‘묶이지(록인)’ 않는 솔루션을 찾아야 한다. 모두 오픈 소스에 기반을 두고 있기 때문에 스트리밍 분석 플랫폼을 가변적으로 더 새롭고 발전된 알고리즘으로 업그레이드할 수 있어야 한다”라고 강조했다. ciokr@idg.co.kr 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.