Offcanvas

How To / 리더십|조직관리 / 빅데이터 | 애널리틱스 / 소프트스킬

'유행 휩쓸린 접근은 곤란' 빅 데이터 프로젝트 가이드라인

2013.04.03 Bob Violino  |  InfoWorld


샤봇은 이어서 “데이터의 출처를 설명하는 메타데이터를 관리하고 그에 기초해 의사 결정을 진행하는 과정은 ‘끼워 맞추기'식 사후 작업으로 이뤄져서는 안 된다. 이러한 활동은 초기 단계에서부터 프로젝트에 통합되어야 한다. 이 과정 가운데 실수로, 혹은 누군가의 고의로 메타데이터에 손상이나 변경이 가해질 가능성도 있다. 이러한 사고를 방지하기 위해서는 디지털 서명(digital signature)과 같은 전문 테크놀로지의 도입 역시 고려해 볼 필요가 있을 것”이라고 조언했다.

프라이버시 법률과 규제 역시 기업들이 고려해야 할 부분이다. 샤봇은 “기업들은 보안 및 프라이버시 규제 준수를 위해 데이터 익명화나 데이터 요소 제거, 데이터 사용 및 배포 제한 등의 방법을 활용할 수 있다”라고 설명했다.

빅 데이터 성공 팁 No.3: 데이터 정밀도가 중요하다
에버딘 그룹(Aberdeen Group)은 최근 연구 발표를 통해 빅 데이터 프로젝트의 성공을 가늠할 수 있는 지표 중 하나로 데이터 정밀도(data accuracy 를 강조한 바 있다.

보고서에 따르면 시장의 우수 기업들(에버딘의 지표에 의해 평가된)은 평균 94%의 데이터 정밀도를 목표로 설정하고 있었으며, 이를 위해 약 1% 수준의 개선이 요구되고 있었다. 반면 평균적인 기업들은 91%의 데이터 정밀도를 목표로 하고 있었으며 이를 위해 18%의 데이터 관리 방법론 향상을 필요로 하고 있었다. ‘후진적' 기업들의 경우에는 목표 데이터 정밀도 80%, 현재 데이터 정밀도 40%라는 결과를 보여줬다.

데이터 정화(cleansing)와 마스터링(mastering)이 빅 데이터 전략에 미치는 영향의 중요성을 잘 보여주는 자료였다.

데이터 관리 및 빅 데이터 컨설팅 기관 카세트라 컨샙츠(Caserta Concepts)의 설립자 겸 CEO 조 카세트라는 “일부의 생각과는 달리 데이터 정화 및 마스터링의 필요성은 늘 존재하는 요인이다. 데이터 소스에 관계 없이 고객, 상품, 직원, 위치 등 모든 데이터를 정리할 수 있는 능력이 필요하다”라고 강조했다.

그는 데이터 분석의 신뢰성에 악영향을 줘왔던 데이터 품질 문제가 제대로 다뤄지지 않는다면 빅 데이터 애널리틱스에도 같은 영향을 끼치게 될 것이라 덧붙였다.

DRC의 샤봇은 일반적 빅 데이터 프로젝트를 진행함에 있어 개발자들은 데이터 관리를 ‘차선적’ 과제로 인식하는 경향을 보여왔고 따라서 문제가 해결되지 않고 남아있는 경우가 많았다고 지적했다.

그는 효율적 데이터 관리를 위해서는 모델 관리, 메타데이터 관리, 참조 데이터 관리, 마스터 데이터 관리, 용어 관리, 데이터 품질 관리, 데이터 목록 관리 등 데이터 관리의 여러 요소들을 제 위치에 배치하는 성숙한 프로세스 및 자동화 테크닉이 필요할 것이라 덧붙였다.

빅 데이터 성공 팁 No.4: 베스트 프랙티스를 수집하라
이제 일부 사람들은 빅 데이터 관리 및 애널리틱스의 과정 중 무엇이 효과적이고 무엇이 효과가 없는 작업인지를 이해하기 시작했다. 그런데, 왜 이런 값진 지식을 기업의 다른 이들과 공유하지 않는 것일까?

공유를 촉진하는 한 방법으로는, 빅 데이터를 다루는 최고 기관(CoE, Center of Excellence)를 설립하는 것이다. 이를 통해 기관 전반에 공동의 리더십과 베스트 프랙티스(best practice), 그리고 지원과 훈련을 제공할 수 있다.

빅 데이터 및 애널리틱스 프로그램 전문 컨설팅 기관 메시브 데이터 인사이트(Massive Data Insight)의 공동 설립자 엘리엇 아놀드는 CoE의 특징을 설명했다. 전용 예산으로 운영되며 문제 분석 및 계획, 미래, 표준 정의, 사용자 훈련, 계획 실행, 프로세스 유지 등의 과정에 목표를 두고 있다는 것이다.

그는 “처음 CoE를 실행하기 위해서는 활용 가능한 자원을 검토하고 상임 위원의 지원을 확보하는 등의 노력이 필요할 것”이라고 말했다.

그러나 DRC의 샤봇은 빅 데이터 CoE가 이론상으론 분명 좋은 아이디어지만, 실질적인 시행 과정이 제대로 이뤄지지 못한다면 적절한 효용성을 담보하기 어려울 것이라 지적했다.

샤봇은 “CoE가 데이터 라이프사이클 전반을 포괄하는 데에는 여러 기본적인 어려움들이 존재한다. 베스트 프랙티스 구축 및 증명, 조사, 적용 가능성 문서화, 채택 현황 감독, 그리고 지속적 보완까지, 모든 과정이 적잖은 어려움을 안겨줄 것”이라고 말했다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.