현대 기업의 원동력은 데이터다. 빨리 정보에 접근해, 이를 토대로 행동을 하는 능력이 핵심 경쟁력이 됐다. 그러나 비즈니스 데이터가 고립되고, 단편적인 경우가 많다. 정보에서 경쟁력을 얻어내기 위해서는 데이터 '싱글뷰(Single View, 단일 보기)'가 필요하다. 몽고DB가 데이터 관리 복잡성을 줄이고 단일 시야를 만들어낼 수 있는 10단계 기법을 제시했다.
기업들이 데이터를 이용하는 과정은 통상 다음과 같다. 다양한 구조의 여러 데이터 소스에서 데이터를 획득하고 변환한 후, 운영 중인 데이터베이스로 불러온다. 그리고 데이터가 필요한 비즈니스 애플리케이션을 지원한다. 분석, BI(Business Intelligence), 보고 도구는 이질적인 데이터 웨어하우스나 데이터 레이크에 위치한 경우가 많은 데이터에 액세스해야 한다. 이 때 이런 계층 모두에 보안 프로토콜, 정보 거버넌스 기준, 기타 운영 요건을 적용해야 한다.
이런 복잡성 때문에 정보가 '사일로'화 되는 경우가 너무 많다. 단기적인 요구 사항을 처리할 시스템을 매번 구축하거나, 서비스에 새로운 기능성을 지원할 새로운 기술을 거듭 추가시키곤 한다. 인수와 합병으로 새로운 데이터 소스가 추가되어 누적된다. 결국 특정 비즈니스 부문의 정보(예, 고객 정보)가 10여 곳의 단절된 장소로 분산된다.
오픈소스 기반의 NoSQL 도큐먼트 지향형 데이터베이스인 몽고DB(MongoDB)의 제품 및 시장 분석 디렉터인 매트 키프는 "우리 모두 주변에 데이터가 많다는 사실을 안다. 매년 40-50%씩 증가하고 있다. 모바일, 웹, 센서 데이터, 소셜 네트워크 등 소스가 많다. 이런 데이터에 대한 ‘싱글뷰’를 구현해야 할 필요가 절실해지고 있다. 아주 복잡하고, 고립된 데이터가 많으며, 일관된 경우가 드물고, 활용하기가 힘들다. 기업들은 아주 오래 전부터 '싱글뷰'를 구축해야 할 필요성을 느껴 왔다"라고 말했다.
몽고DB는 고객에게 서비스를 제공하면서 힘들게 얻은 경험을 토대로 조직이 데이터 '싱글뷰'를 구현할 수 있는 10단계의 방법을 개발했다.
(클릭하면 이미지 커짐)
1단계: 프로젝트 범위와 스폰서십을 규정
키프는 고객사들이 아주 야심 찬 계획을 수립해 '싱글뷰' 프로젝트를 추진하는 때가 많다고 말했다. 비전을 갖는 것은 좋지만, 처음부터 보유한 모든 시스템의 고객 데이터에 대해 '싱글뷰'를 마련하려 계획하는 시도는 대개 실수다.
그는 "프로젝트 첫 단계에서 모든 데이터에 '싱글뷰'를 계획하는 것은 지나치게 야심 찬 계획이다. 한 가지 비즈니스 문제에 초점을 맞춰야 가장 성공 확률이 높다는 사실을 발견했다"라고 말했다.
예를 들어, 콜센터의 MTTR(Mean Time To Resolution)을 줄인다는 목표를 세울 수 있다. 이렇게 프로젝트 범위를 특정 목표로 좁혀야 한다. 그래야 더 쉽게 성과를 일궈낼 수 있는 데이터를 찾을 수 있다.
(클릭하면 이미지 커짐)
키프는 "뛰기 전에 걷는 법부터 배워야 한다. 특정 비즈니스 문제를 출발점으로 삼아야 한다. 그래야 필요한 데이터, 성과를 측정할 수 있는 목표를 파악할 수 있다"라고 설명했다.
이는 또 이점을 누릴 핵심 이해당사자를 파악하는데 도움을 준다는 설명이다. 매일 프로젝트에 관여하지 않지만, 프로젝트가 성공할 수 있도록 필요한 리소스를 지원할 수 있는 사람들이 누군지 이해할 수 있게 해준다고 키프는 덧붙였다.
2단계: 데이터 소비자를 파악
해결하고 싶은 비즈니스 문제를 파악한 후, 구현할 데이터 '싱글뷰'를 소비할 사람들을 이해해야 한다. 이들이 누구인지, 어떤 식으로 일을 하는지, 어떻게 해야 업무를 능률화 할 수 있는지 파악해야 요구 사항을 올바르게 정립할 수 있다.
키프는 "이들에게 일정 시간을 투자해 관찰해야 한다. 어떤 식으로 데이터를 쿼리할까? 텍스트를 검색할까? 고객 ID로 검색할까? 필요 이상으로 복잡해지면 곤란하다. 충분한 데이터를 얻을 수 없다"라고 말했다.
몽고DB는 보험사인 메트라이프(MetLife)가 콜 센터 직원들을 위한 '싱글뷰'를 구현하는 프로젝트를 도왔었다. 관찰을 통해, 콜센터 직원들이 흔한 고객 질문에 대답을 하기 위해 많게는 15개의 화면을 탐색해야 한다는 사실을 발견했다. 메트라이프와 몽고DB는 콜센터 직원들이 고객의 질문에 답을 제공하는 과정을 정확히 관찰해 훨씬 더 단순한 시스템을 구축할 수 있었다.
(클릭하면 이미지 커짐)
3단계: 데이터 생산자를 파악
2단계와 연결된 3단계는 프로젝트에 필요한 데이터를 생산하는 데이터 소스를 파악하는 것이다.
키프는 "새 데이터 소스를 만들어야 할 수도 있지만, 이미 데이터가 있는 경우가 많다. 그 장소와 획득 방법을 파악해야 한다. 새로운 특성이 반영되도록 기존 애플리케이션을 바꾸거나, 수동인 부분을 디지털화하는 것이 여기에 포함된다. 2단계와 마찬가지로 필요한 요구 사항 파악에 도움을 준다”라고 말했다.
4단계: 데이터 스튜어드(관리인) 지정
앞서 단계들은 '싱글뷰' 프로젝트의 '발견(시작)' 단계에 해당된다. 모두 요구 사항의 틀을 만드는데 초점이 맞춰져 있다. 4단계는 소스 시스템 데이터를 책임질 데이터 스튜어드를 임명하는 것으로, 개발 단계의 출발점에 해당한다. 데이터 스튜어드는 '싱글뷰' 프로젝트를 수립하고, 이후 지속적으로 관리하는 과정에 아주 중요한 역할을 한다.
키프는 "그는 통상 2-3단계에서 발견한 데이터 소스를 책임진다. 데이터가 위치한 테이블, 형식, 추출 방법을 알고 있다. 또 핵심 데이터 시스템에 방해를 초래하지 않으면서 데이터를 활용하는 방법이 있는지 안다"라고 설명했다.
-> 기고 | 애널리틱스 확산··· '데이터 스튜어드'가 필요하다
5단계: '싱글뷰' 모델 개발
이후 모든 것에 영향을 끼치는 아주 중요한 단계이다. 키프는 앞서 발견 단계를 성공적으로 이행했다면 그리 어렵지 않게 마무리할 수 있는 단계라고 강조했다. 데이터의 종류, 위치한 장소, 쿼리 방법을 파악해야 한다.
키프는 "반드시 필요한 데이터 종류, 선택할 수 있는 데이터 종류를 조사하는 단계다. 예를 들어, 이메일 주소와 생년월일, 신용카드 번호가 반드시 필요한 애플리케이션이 존재할 수 있다. 그러나 소셜 미디어 계정 데이터는 선택 사항에 해당하는 데이터가 될 수 있다. 이후 인덱스로 분류해야 할 데이터 종류를 파악한다. 그러면 소비 애플리케이션에서 실행시키고 싶은 쿼리의 속도를 높일 수 있다. 유연한 데이터 모델이 큰 도움을 줄 것이다. 옵션 필드를 알 필요가 없다. 필요한 경우 추가할 수 있기 때문이다. 반드시 필요한 데이터만 선택하면 된다"라고 말했다.