2021.04.14

‘도구에서 전략까지’ 데이터 애널리틱스 ABC

Bob Violino | InfoWorld
데이터 애널리틱스는 분명 기업들에게 상당한 경쟁 차별화 요소가 될 수 있다. 매출과 시장 점유율을 높이는 데 도움이 될 수 있는 인사이트를 제공할 가능성을 지닌다. 하지만 최신 기술을 얼마나 잘 활용하고 미래의 발전에 얼마나 대비하고 있는지에 따라 그 성과는 크게 엇갈릴 수 있다. 데이터 애널리틱스 베스트 프랙티스를 살펴본다. 
 
Image Credit : Getty Images Bank


셀프 서비스 분석을 활용하라
셀프 서비스 분석을 통해 비즈니스 사용자는 IT의 지원을 거의 받지 않고 고급 분석 스킬 없이도 스스로 쿼리를 수행하고 보고서를 생성할 수 있다. 기본적인 분석 기능이 있는 사용이 간편한 BI 도구를 활용해서다.

셀프 서비스 분석 접근방식은 숙련된 데이터 분석가 부족으로 인한 공백을 메우는데 도움이 될 수 있다. 또 업무상 데이터 필요한 사용자에게 데이터를 직접 제공할 수 있다는 장점도 구현한다.

즉 현업 사용자는 데이터 사이언티스트(Data Scientist)나 기타 분석 전문가가 보고서를 생성할 때까지 기다리지 않고 데이터 분석을 기반으로 결정을 내릴 수 있다. 이는 시장 변화 또는 변화하는 고객 요구에 신속하게 대응하기 위해 움직여야 하는 기업들에게 큰 장점이 될 수 있다.

셀프 서비스 분석의 첫 번째 단계는 정보 요건과 필요한 도구를 포함해 사용자들의 현실을 전체적으로 이해하는 것이라고 IT 컨설팅 기업 CTG(Computer Task Group)의 수석 솔루션 설계자 존 월튼이 말했다.

월튼은 “정보 소비자와 임원 주주들은 데이터 사이언티스트와 요구하는 분석 도구 스위트가 전혀 다르다. 도구를 현업 요건에 맞추는 것이 매우 중요하다. 또한 셀프 서비스 분석은 깔끔한 데이터에 크게 좌우된다. 정보 이해관계자가 사용하고 있는 대시보드에 대한 신뢰를 잃을 경우 신뢰를 회복하기가 매우 어렵다. ‘도대체 내가 뭘 보고 있는지 모르겠다’고 말하고 사라질 것이다”라고 말했다.

또한 데이터 거버넌스 이니셔티브를 통해 정보 일관성을 수립하는 것도 좋은 생각이라고 월튼이 말했다. 그는 “이것이 마련되면 차원 데이터 아키텍처를 셀프 서비스 분석을 위한 ‘배관’으로 활용할 수 있다”라고 말했다.

이런 아키텍처에서 대시보드에 표시된 주요 성과 지표와 측정값은 승인된 비즈니스 규칙에 따라 사전에 계산된 것들이다. 또 적절한 비즈니스 필터 또는 분석의 차원과 관련되어 있고 데이터베이스에 저장된다. 분석 도구 사용자는 이 모든 힘든 작업을 할 필요가 없다고 월튼이 말했다.

머신러닝 역량을 배치하라
머신러닝(ML)은 데이터 분석 프로세스 개선에 중요한 역할을 할 수 있으며, 엄청난 양의 정보를 취급하는 조직의 경우에는 더욱 그렇다.

머신러닝에는 애널리틱스와 다른 아키텍처가 필요할 것이라고 월튼이 말했다. 그는 “데이터를 왜곡하고 잠재적으로 중요한 인사이트를 모호하게 만드는 사전에 계산된 지표를 적용하면 안 된다. ML은 그 역량을 가장 효과적으로 적용하기 위해 대부분은 관계형 데이터베이스 안에서 많은 양의 매우 세부적인 정보를 처리한다”라고 말했다.

예를 들어, 보험 부문의 기업은 엄청난 양의 청구 데이터, 환자 대응 데이터, 구조화된 메모와 비구조화 된 메모 등 많은 양의 데이터를 처리할 수도 있다.

머신러닝의 모범 사례는 올바른 목적을 위해 올바른 데이터 계층을 사용하는 것이라고 월튼이 말했다. 그는 “하단의 ‘수집’ 계층은 다양한 소스로부터 얻는 모든 데이터이며, 가장 덜 가공된 데이터가 ML에 이상적이다”라고 말했다.

미들 또는 ‘일치’(conformance) 레이어에서 데이터는 사전 수립된 데이터 거버넌스 규칙에 따라 표준에 맞추게 된다고 월튼이 말했다. 일련의 집중된 데이터 마트로 구성된 상위 레이어가 애널리틱스에 이상적이라고 그가 말했다.

데이터 E2E를 관리하라
많은 조직들이 다양한 소스로부터 얻은 엄청난 양의 데이터를 관리하느라 분투하고 있으며, 이로 인해 애널리틱스 이니셔티브가 좌초될 수 있다. 기업 전반의 데이터 관리를 돕기 위해 기술을 배치할 만한 이유다.

의료 공급 기업 폴 하트만 AG(Paul Hartmann AG)는 SAP의 데이터 허브(Data Hub)라는 중앙 관리 플랫폼을 사용하여 여러 내부 및 외부 소스로부터 얻은 데이터를 통합, 액세스, 분석한다. 목표는 데이터의 잠재력을 극대화하고 제조 및 공급망 최적화에 필요한 인사이트를 얻는 것이라고 CIO 겸 CDO 시나누딘 오메로직이 말했다.

오메로직은 “이런 발견사항에 접근할 수 있게 되면 고객들이 언제든지 필요한 제품을 확보할 수 있도록 도와 궁극적으로 환자의 생명을 살릴 수 있다”라고 말했다.

데이터 허브 기술을 활용함으로써 하트만은 고객, 공급자, 운영 데이터를 위한 ‘단일 정보원’을 수립하여 고객 문제를 더욱 잘 이해할 수 있도록 도울 수 있었다.

해당 기업은 현재 AI, IoT, 예측 분석 등의 기술을 더욱 잘 활용할 수 있다. 그리고 날씨와 전염병 등의 요소에 대한 새로운 데이터 소스를 활용하여 병원 및 약국에서의 수요를 더욱 잘 예측하고 필요한 용품을 적절한 시기에 적절한 양만큼 확보하도록 할 수 있다.

현업 사용자에게도 전체적인 데이터 전략을 교육하라
데이터 인사이트를 활용할 현업 사용자는 데이터 사이언스, AI, 머신러닝, 데이터 분석 전체에 대한 회사의 전략을 이해해야 한다. 이를 통해 현 상황을 이해할 가능성이 높아진다.




2021.04.14

‘도구에서 전략까지’ 데이터 애널리틱스 ABC

Bob Violino | InfoWorld
데이터 애널리틱스는 분명 기업들에게 상당한 경쟁 차별화 요소가 될 수 있다. 매출과 시장 점유율을 높이는 데 도움이 될 수 있는 인사이트를 제공할 가능성을 지닌다. 하지만 최신 기술을 얼마나 잘 활용하고 미래의 발전에 얼마나 대비하고 있는지에 따라 그 성과는 크게 엇갈릴 수 있다. 데이터 애널리틱스 베스트 프랙티스를 살펴본다. 
 
Image Credit : Getty Images Bank


셀프 서비스 분석을 활용하라
셀프 서비스 분석을 통해 비즈니스 사용자는 IT의 지원을 거의 받지 않고 고급 분석 스킬 없이도 스스로 쿼리를 수행하고 보고서를 생성할 수 있다. 기본적인 분석 기능이 있는 사용이 간편한 BI 도구를 활용해서다.

셀프 서비스 분석 접근방식은 숙련된 데이터 분석가 부족으로 인한 공백을 메우는데 도움이 될 수 있다. 또 업무상 데이터 필요한 사용자에게 데이터를 직접 제공할 수 있다는 장점도 구현한다.

즉 현업 사용자는 데이터 사이언티스트(Data Scientist)나 기타 분석 전문가가 보고서를 생성할 때까지 기다리지 않고 데이터 분석을 기반으로 결정을 내릴 수 있다. 이는 시장 변화 또는 변화하는 고객 요구에 신속하게 대응하기 위해 움직여야 하는 기업들에게 큰 장점이 될 수 있다.

셀프 서비스 분석의 첫 번째 단계는 정보 요건과 필요한 도구를 포함해 사용자들의 현실을 전체적으로 이해하는 것이라고 IT 컨설팅 기업 CTG(Computer Task Group)의 수석 솔루션 설계자 존 월튼이 말했다.

월튼은 “정보 소비자와 임원 주주들은 데이터 사이언티스트와 요구하는 분석 도구 스위트가 전혀 다르다. 도구를 현업 요건에 맞추는 것이 매우 중요하다. 또한 셀프 서비스 분석은 깔끔한 데이터에 크게 좌우된다. 정보 이해관계자가 사용하고 있는 대시보드에 대한 신뢰를 잃을 경우 신뢰를 회복하기가 매우 어렵다. ‘도대체 내가 뭘 보고 있는지 모르겠다’고 말하고 사라질 것이다”라고 말했다.

또한 데이터 거버넌스 이니셔티브를 통해 정보 일관성을 수립하는 것도 좋은 생각이라고 월튼이 말했다. 그는 “이것이 마련되면 차원 데이터 아키텍처를 셀프 서비스 분석을 위한 ‘배관’으로 활용할 수 있다”라고 말했다.

이런 아키텍처에서 대시보드에 표시된 주요 성과 지표와 측정값은 승인된 비즈니스 규칙에 따라 사전에 계산된 것들이다. 또 적절한 비즈니스 필터 또는 분석의 차원과 관련되어 있고 데이터베이스에 저장된다. 분석 도구 사용자는 이 모든 힘든 작업을 할 필요가 없다고 월튼이 말했다.

머신러닝 역량을 배치하라
머신러닝(ML)은 데이터 분석 프로세스 개선에 중요한 역할을 할 수 있으며, 엄청난 양의 정보를 취급하는 조직의 경우에는 더욱 그렇다.

머신러닝에는 애널리틱스와 다른 아키텍처가 필요할 것이라고 월튼이 말했다. 그는 “데이터를 왜곡하고 잠재적으로 중요한 인사이트를 모호하게 만드는 사전에 계산된 지표를 적용하면 안 된다. ML은 그 역량을 가장 효과적으로 적용하기 위해 대부분은 관계형 데이터베이스 안에서 많은 양의 매우 세부적인 정보를 처리한다”라고 말했다.

예를 들어, 보험 부문의 기업은 엄청난 양의 청구 데이터, 환자 대응 데이터, 구조화된 메모와 비구조화 된 메모 등 많은 양의 데이터를 처리할 수도 있다.

머신러닝의 모범 사례는 올바른 목적을 위해 올바른 데이터 계층을 사용하는 것이라고 월튼이 말했다. 그는 “하단의 ‘수집’ 계층은 다양한 소스로부터 얻는 모든 데이터이며, 가장 덜 가공된 데이터가 ML에 이상적이다”라고 말했다.

미들 또는 ‘일치’(conformance) 레이어에서 데이터는 사전 수립된 데이터 거버넌스 규칙에 따라 표준에 맞추게 된다고 월튼이 말했다. 일련의 집중된 데이터 마트로 구성된 상위 레이어가 애널리틱스에 이상적이라고 그가 말했다.

데이터 E2E를 관리하라
많은 조직들이 다양한 소스로부터 얻은 엄청난 양의 데이터를 관리하느라 분투하고 있으며, 이로 인해 애널리틱스 이니셔티브가 좌초될 수 있다. 기업 전반의 데이터 관리를 돕기 위해 기술을 배치할 만한 이유다.

의료 공급 기업 폴 하트만 AG(Paul Hartmann AG)는 SAP의 데이터 허브(Data Hub)라는 중앙 관리 플랫폼을 사용하여 여러 내부 및 외부 소스로부터 얻은 데이터를 통합, 액세스, 분석한다. 목표는 데이터의 잠재력을 극대화하고 제조 및 공급망 최적화에 필요한 인사이트를 얻는 것이라고 CIO 겸 CDO 시나누딘 오메로직이 말했다.

오메로직은 “이런 발견사항에 접근할 수 있게 되면 고객들이 언제든지 필요한 제품을 확보할 수 있도록 도와 궁극적으로 환자의 생명을 살릴 수 있다”라고 말했다.

데이터 허브 기술을 활용함으로써 하트만은 고객, 공급자, 운영 데이터를 위한 ‘단일 정보원’을 수립하여 고객 문제를 더욱 잘 이해할 수 있도록 도울 수 있었다.

해당 기업은 현재 AI, IoT, 예측 분석 등의 기술을 더욱 잘 활용할 수 있다. 그리고 날씨와 전염병 등의 요소에 대한 새로운 데이터 소스를 활용하여 병원 및 약국에서의 수요를 더욱 잘 예측하고 필요한 용품을 적절한 시기에 적절한 양만큼 확보하도록 할 수 있다.

현업 사용자에게도 전체적인 데이터 전략을 교육하라
데이터 인사이트를 활용할 현업 사용자는 데이터 사이언스, AI, 머신러닝, 데이터 분석 전체에 대한 회사의 전략을 이해해야 한다. 이를 통해 현 상황을 이해할 가능성이 높아진다.


X