2015.08.19

기고 | 애널리틱스 확산··· '데이터 스튜어드'가 필요하다

Kumar Srivastava | CIO
데이터 과학자가 수행해온 전통적인 역할은 다음과 같다. 데이터 분석을 필요로 하지만 데이터와 애널리틱스 도구 활용에 어려움을 겪는 기업 내 사용자들을 지원하는 것이다. 하지만 이제는 그것만으로 충분하지 않은 시점이 됐다.

기업 환경은 데이터 과학자들에게, 데이터가 담고 있는 진실을 보다 정확하고 올바르게 해석해내는 ‘데이터 담당자’ (data steward)로의 진화를 요구하고 있다.

기업 전반에서 데이터에 대한 이해 수준이 높아지고 애널리틱스 툴이 활발히 보급됨에 따라 기업 내부의 데이터 민주화는 상당한 진척을 이뤘다. 그로 인해 비즈니스 의사 결정과 사고 역시 보다 합리적으로 변모하고 있다. 그러나 이런 변화는 동시에 기업들에게 새로운 과제 역시 제시했다.

Credit: evan p. cordes via Flickr


애널리틱스 도입 확대가 가져온 새로운 과제
데이터 및 데이터 애널리틱스 도구가 널리 활용됨에 따라 이전에는 없던 새로운 문제들이 출현했다.

먼저 애널리틱스 플랫폼은 더 많은 사용자 집단과 더욱 다양한 데이터 소스, 쉼 없이 밀려오는 데이터들을 모두 수용할 수 있도록 구조를 개편해야 했다. 또 수요의 증대로 인해 애널리틱스 속도 역시 개선이 필요해졌다. 그리고 기업들은 고품질 데이터 분석 과정을 정의, 실행할 수 있도록 적절한 대비를 해야 했다.

기업들은 또 분석/시각화/해석/제안 작업을 위해 데이터 애널리틱스를 상시 적용할 수 있도록 하기 위해, 다음의 사항들을 확인해야 할 필요가 있다:

1. 투입 데이터 세트 생성과 관련한 어떠한 부정확한 가설도 있어선 안 된다.

2. 데이터 의미를 오역하지 않도록 주의한다.

3. 부정확한 분석 구조는 결함 있는 결과로 이어짐을 명심한다.

4. 다르거나 왜곡된 사실을 지지하기 위해 분석을 부정확하게 시각화는 경우에 주의해야 한다. 이는 정확한 시각화 해석을 더욱 어렵게 한다.

진화하는 데이터 과학자의 역할
가정을 규명하는 것이 아닌 애초에 가정을 증명하려는 목적으로 설계된 애널리틱스 사례는 무수히 많다. 직감에 의존하는 직원들(특히 보수적 방법론에 익숙한)의 경향성을 무작정 외면하기란 기업 입장에서 쉽지 않은 일이다. 이런 직원들은 자신들의 생각과 입장을 지지하는 분석 도구와 방법론만을 언급하며, 그것을 찾지 못했을 경우 분석을 왜곡하기도 한다.

이러한 문제를 저지하기 위해 데이터 과학자들에게 요구되는 것이 바로 ‘데이터 담당자’로서의 역할이다. 데이터 담당자의 책무는 어떤 애널리틱스 툴이 적절한 논거와 논리에 기초해 체계적으로 과학적으로 이용되는지, 그리고 그것이 기업의 전략과 활동에 기여할 수 있을지를 보장하는 것이다.

애널리틱스 과정에 부정확한 가정이 개입되지는 않는지, 그로 인해 설립된 프로세스에 오류가 있지 않은지, 그리고 산출된 시각화와 해석에 결함은 없는지를 확인하고 문제를 신속히 해결하는 것이 그들에게 주어진 역할이다.

편견과 경향성에 의한 애널리틱스 왜곡의 문제는 학계에서도 흥미로운 주제로 다뤄져 왔으며, 그 덕분에 관련 방법론들이 다수 제안되고 있다. 데이터 담당자들에게 도움이 될 만한 것들이다.

데이터 담당자는 언제나 능동적으로 분석 프로세스의 확립 여부를 확인하고, 필요한 애널리틱스 상품을 투자, 활용해 다음의 사항들을 구현해야 한다.

이중 은폐(Double blind) 애널리틱스
애널리틱스 솔루션이 직원들을 분석 과정에서 완전히 분리하는, ‘이중 은폐’ 실험 환경과 동일한 분석 환경을 구축한다면, 동일 데이터 세트를 구동한 분석 결과물은 아무리 실행이 반복되어도 동일할 것이며 솔루션의 이용과 개시 역시 보다 수월해질 것이다.

동료 리뷰
애널리틱스 솔루션은 협업 기능을 갖춰 직원 조직에 점검과 조정, 인터뷰, 문의, 분석 강화의 여지를 보장해야 한다.

참조와 참조 무결성
애널리틱스 솔루션의 인터페이스와 분석, 추론적 상태 보존 기능은 기존의 분석 결과물들을 기반으로 하여 새로운 결론을 도출할 수 있어야 한다.

결론 내리자면, 데이터 과학자들은 데이터와 애널리틱스 툴이 모든 직원들에게 민주화되고 개방된 이 새로운 세계의 새로운 요구와 압력을 받아들일 수 있도록 스스로를 진화시킬 필요가 있다.

그들의 기업이 보다 심도 있는 애널리틱스 프로세스와 프래틱스를 받아들이고, 또 그러한 심도 있는 프래틱스를 구현할 상품과 플랫폼을 받아들이도록 보장하는 것이 그들에게 주어진 새로운 역할이다.

또한 데이터를 이용하지 않는 것보다 결함 있는 분석 과정을 통해 비즈니스 전략에 위해를 가하는 결정을 내리는 것이 더욱 안 좋은 문제라는 점 역시 반드시 숙지시켜야 한다. 이러한 실수로 인한 투자 실패나 고객 불만족 및 이탈은 다시 되돌릴 수 없다.

* Kumar Srivastava는 빅데이터, 애널리틱스, 클라우드, 모바일, 디지털 분야를 전문으로 하는 전문 기고가다. cior@idg.co.kr 



2015.08.19

기고 | 애널리틱스 확산··· '데이터 스튜어드'가 필요하다

Kumar Srivastava | CIO
데이터 과학자가 수행해온 전통적인 역할은 다음과 같다. 데이터 분석을 필요로 하지만 데이터와 애널리틱스 도구 활용에 어려움을 겪는 기업 내 사용자들을 지원하는 것이다. 하지만 이제는 그것만으로 충분하지 않은 시점이 됐다.

기업 환경은 데이터 과학자들에게, 데이터가 담고 있는 진실을 보다 정확하고 올바르게 해석해내는 ‘데이터 담당자’ (data steward)로의 진화를 요구하고 있다.

기업 전반에서 데이터에 대한 이해 수준이 높아지고 애널리틱스 툴이 활발히 보급됨에 따라 기업 내부의 데이터 민주화는 상당한 진척을 이뤘다. 그로 인해 비즈니스 의사 결정과 사고 역시 보다 합리적으로 변모하고 있다. 그러나 이런 변화는 동시에 기업들에게 새로운 과제 역시 제시했다.

Credit: evan p. cordes via Flickr


애널리틱스 도입 확대가 가져온 새로운 과제
데이터 및 데이터 애널리틱스 도구가 널리 활용됨에 따라 이전에는 없던 새로운 문제들이 출현했다.

먼저 애널리틱스 플랫폼은 더 많은 사용자 집단과 더욱 다양한 데이터 소스, 쉼 없이 밀려오는 데이터들을 모두 수용할 수 있도록 구조를 개편해야 했다. 또 수요의 증대로 인해 애널리틱스 속도 역시 개선이 필요해졌다. 그리고 기업들은 고품질 데이터 분석 과정을 정의, 실행할 수 있도록 적절한 대비를 해야 했다.

기업들은 또 분석/시각화/해석/제안 작업을 위해 데이터 애널리틱스를 상시 적용할 수 있도록 하기 위해, 다음의 사항들을 확인해야 할 필요가 있다:

1. 투입 데이터 세트 생성과 관련한 어떠한 부정확한 가설도 있어선 안 된다.

2. 데이터 의미를 오역하지 않도록 주의한다.

3. 부정확한 분석 구조는 결함 있는 결과로 이어짐을 명심한다.

4. 다르거나 왜곡된 사실을 지지하기 위해 분석을 부정확하게 시각화는 경우에 주의해야 한다. 이는 정확한 시각화 해석을 더욱 어렵게 한다.

진화하는 데이터 과학자의 역할
가정을 규명하는 것이 아닌 애초에 가정을 증명하려는 목적으로 설계된 애널리틱스 사례는 무수히 많다. 직감에 의존하는 직원들(특히 보수적 방법론에 익숙한)의 경향성을 무작정 외면하기란 기업 입장에서 쉽지 않은 일이다. 이런 직원들은 자신들의 생각과 입장을 지지하는 분석 도구와 방법론만을 언급하며, 그것을 찾지 못했을 경우 분석을 왜곡하기도 한다.

이러한 문제를 저지하기 위해 데이터 과학자들에게 요구되는 것이 바로 ‘데이터 담당자’로서의 역할이다. 데이터 담당자의 책무는 어떤 애널리틱스 툴이 적절한 논거와 논리에 기초해 체계적으로 과학적으로 이용되는지, 그리고 그것이 기업의 전략과 활동에 기여할 수 있을지를 보장하는 것이다.

애널리틱스 과정에 부정확한 가정이 개입되지는 않는지, 그로 인해 설립된 프로세스에 오류가 있지 않은지, 그리고 산출된 시각화와 해석에 결함은 없는지를 확인하고 문제를 신속히 해결하는 것이 그들에게 주어진 역할이다.

편견과 경향성에 의한 애널리틱스 왜곡의 문제는 학계에서도 흥미로운 주제로 다뤄져 왔으며, 그 덕분에 관련 방법론들이 다수 제안되고 있다. 데이터 담당자들에게 도움이 될 만한 것들이다.

데이터 담당자는 언제나 능동적으로 분석 프로세스의 확립 여부를 확인하고, 필요한 애널리틱스 상품을 투자, 활용해 다음의 사항들을 구현해야 한다.

이중 은폐(Double blind) 애널리틱스
애널리틱스 솔루션이 직원들을 분석 과정에서 완전히 분리하는, ‘이중 은폐’ 실험 환경과 동일한 분석 환경을 구축한다면, 동일 데이터 세트를 구동한 분석 결과물은 아무리 실행이 반복되어도 동일할 것이며 솔루션의 이용과 개시 역시 보다 수월해질 것이다.

동료 리뷰
애널리틱스 솔루션은 협업 기능을 갖춰 직원 조직에 점검과 조정, 인터뷰, 문의, 분석 강화의 여지를 보장해야 한다.

참조와 참조 무결성
애널리틱스 솔루션의 인터페이스와 분석, 추론적 상태 보존 기능은 기존의 분석 결과물들을 기반으로 하여 새로운 결론을 도출할 수 있어야 한다.

결론 내리자면, 데이터 과학자들은 데이터와 애널리틱스 툴이 모든 직원들에게 민주화되고 개방된 이 새로운 세계의 새로운 요구와 압력을 받아들일 수 있도록 스스로를 진화시킬 필요가 있다.

그들의 기업이 보다 심도 있는 애널리틱스 프로세스와 프래틱스를 받아들이고, 또 그러한 심도 있는 프래틱스를 구현할 상품과 플랫폼을 받아들이도록 보장하는 것이 그들에게 주어진 새로운 역할이다.

또한 데이터를 이용하지 않는 것보다 결함 있는 분석 과정을 통해 비즈니스 전략에 위해를 가하는 결정을 내리는 것이 더욱 안 좋은 문제라는 점 역시 반드시 숙지시켜야 한다. 이러한 실수로 인한 투자 실패나 고객 불만족 및 이탈은 다시 되돌릴 수 없다.

* Kumar Srivastava는 빅데이터, 애널리틱스, 클라우드, 모바일, 디지털 분야를 전문으로 하는 전문 기고가다. cior@idg.co.kr 

X