2013.10.04

CRM 데이터 중복 제거의 딜레마, 어떻게 해결할 것인가

David Taber | CIO
기업 내 명확한 데이터 중복 제거 전략이 마련돼 있지 않다면, 분명 CRM 시스템에 일정 수준의 중복 기록이 존재하고 있을 것이다. 그 이유는 다음과 같다.

● 우리는 새로운 계약 기록, 사례, 계정을 추가하기에 앞서 기존 기록을 검색하는 번거로움을 원치 않는다. CRM 시스템에 어떠한 중복 알람 시스템이 갖춰져 있는 경우라도, 이것에 주의를 기울이는 이는 별로 없는 것이 현실이다. 모바일 기기에서는 알람 시스템이 작동되는 경우 자체가 드물다.

● 일부는 ‘잠재적 중복' 표시를 활용하기도 하지만, 일반적으로 데이터 반입 툴은 중복 기록을 확인하는데 취약하며, 중복을 확인하는 경우에도 일단은 데이터를 받아들인다.

● 웹사이트 등록 양식이나 협력사 포탈, 메시지 브로커 등 외부의 여타 애플리케이션 소스들과의 통합 과정에서 신규 기록을 CRM 데이터에 삽입하기에 앞서 확인을 요구하는 단계는 별도로 마련되지 않을 것이다. 일부 경우 외부 소스에서 중복이 발견되더라도 추가는 기존 기록의 업데이트가 아닌 신규 기록 생성 방식으로 이뤄질 것이다.

● 내부 CRM 시스템 및 연계 애플리케이션 내부의 몇몇 관리 오류 및 소프트웨어 버그는 일순간에 수 천의 중복 기록을 생성할 수 있다.

중복 기록은, 그것이 단기적인 문제고 이를 포착, 수정할 수 있는 프로세스가 존재할 경우 2% 가량은 허용될 수 있다. 그리고 중복률이 5%를 넘어갈 경우, 사용자 불만이 시작될 수 있다. 본격적으로 보고에 혼란이 발생하기 때문이다. 사용자가 시행한 변화가 유실됨에 따라 데이터 업데이트 기록이 손상되는 상황도 발생할 수 있다. 시스템 신뢰도에도 타격이 가해질 것이다. 상황이 더욱 악화되어 중복률이 25%를 넘어가게 되면, 시스템 자체가 위협받게 될 것이다.

데이터 중복의 감지와 수정은, 시간이 필요한 작업이다
데이터 오염을 손보는 과정은 오염의 유형이 무엇이든 상당한 시간 투자를 요구한다. 이를 위해 당신은 비용, 시간 상황에 대한 정확한 이해에 기초하여 방법론적 예상 복구 계획을 수립해야 한다.

첫 단계는 데이터 입력 과정에서 사용자들에게 경고를 전달할 최상의 중복 감지 툴을 선택하는 것이다. 툴을 선택했다면 설치하기에 앞서, 이것이 외부 시스템들을 통합하는 과정을 큰 오류 없이 수행할 수 있는지 테스트해보라.


다음 단계는 중복 데이터의 시스템 소스를 분석하는 것이다. 한, 두 개의 외부 데이터 시스템으로 초점을 좁히고, 팀 작업을 통해 새로운 중복 데이터의 유입을 차단해보자. 이 과정은 꼼꼼하고 반복적일수록 좋다.

그와 동시에 발견된 중복 자체에 대한 분석도 진행할 필요가 있다. 운이 좋다면 한 두 개의 테이블(table)을 분석하는 것으로도 충분할 수 있다. 하지만 이 경우에도 각 테이블은 각자의 패턴(군)을 지니고 있음을 기억하자. 데이터 중복 제거는 반복적 접근법을 요구하기 때문에, 당신은 팀원들이 가장 리스크가 낮은 테이블의 툴과 프로세스에 익숙해지도록 해야 할 것이다. ‘가장 리스크가 낮은'이란 표현이 지니는 의미는 매우 가변적이지만, 사례 혹은 활동은 최선의 후보로 제시되는 경우가 일반적이다. 이들로 향해지는 타 기록의 수가 가장 적은 사례 혹은 활동을 의미하는 경향이 있기 때문이다.




2013.10.04

CRM 데이터 중복 제거의 딜레마, 어떻게 해결할 것인가

David Taber | CIO
기업 내 명확한 데이터 중복 제거 전략이 마련돼 있지 않다면, 분명 CRM 시스템에 일정 수준의 중복 기록이 존재하고 있을 것이다. 그 이유는 다음과 같다.

● 우리는 새로운 계약 기록, 사례, 계정을 추가하기에 앞서 기존 기록을 검색하는 번거로움을 원치 않는다. CRM 시스템에 어떠한 중복 알람 시스템이 갖춰져 있는 경우라도, 이것에 주의를 기울이는 이는 별로 없는 것이 현실이다. 모바일 기기에서는 알람 시스템이 작동되는 경우 자체가 드물다.

● 일부는 ‘잠재적 중복' 표시를 활용하기도 하지만, 일반적으로 데이터 반입 툴은 중복 기록을 확인하는데 취약하며, 중복을 확인하는 경우에도 일단은 데이터를 받아들인다.

● 웹사이트 등록 양식이나 협력사 포탈, 메시지 브로커 등 외부의 여타 애플리케이션 소스들과의 통합 과정에서 신규 기록을 CRM 데이터에 삽입하기에 앞서 확인을 요구하는 단계는 별도로 마련되지 않을 것이다. 일부 경우 외부 소스에서 중복이 발견되더라도 추가는 기존 기록의 업데이트가 아닌 신규 기록 생성 방식으로 이뤄질 것이다.

● 내부 CRM 시스템 및 연계 애플리케이션 내부의 몇몇 관리 오류 및 소프트웨어 버그는 일순간에 수 천의 중복 기록을 생성할 수 있다.

중복 기록은, 그것이 단기적인 문제고 이를 포착, 수정할 수 있는 프로세스가 존재할 경우 2% 가량은 허용될 수 있다. 그리고 중복률이 5%를 넘어갈 경우, 사용자 불만이 시작될 수 있다. 본격적으로 보고에 혼란이 발생하기 때문이다. 사용자가 시행한 변화가 유실됨에 따라 데이터 업데이트 기록이 손상되는 상황도 발생할 수 있다. 시스템 신뢰도에도 타격이 가해질 것이다. 상황이 더욱 악화되어 중복률이 25%를 넘어가게 되면, 시스템 자체가 위협받게 될 것이다.

데이터 중복의 감지와 수정은, 시간이 필요한 작업이다
데이터 오염을 손보는 과정은 오염의 유형이 무엇이든 상당한 시간 투자를 요구한다. 이를 위해 당신은 비용, 시간 상황에 대한 정확한 이해에 기초하여 방법론적 예상 복구 계획을 수립해야 한다.

첫 단계는 데이터 입력 과정에서 사용자들에게 경고를 전달할 최상의 중복 감지 툴을 선택하는 것이다. 툴을 선택했다면 설치하기에 앞서, 이것이 외부 시스템들을 통합하는 과정을 큰 오류 없이 수행할 수 있는지 테스트해보라.


다음 단계는 중복 데이터의 시스템 소스를 분석하는 것이다. 한, 두 개의 외부 데이터 시스템으로 초점을 좁히고, 팀 작업을 통해 새로운 중복 데이터의 유입을 차단해보자. 이 과정은 꼼꼼하고 반복적일수록 좋다.

그와 동시에 발견된 중복 자체에 대한 분석도 진행할 필요가 있다. 운이 좋다면 한 두 개의 테이블(table)을 분석하는 것으로도 충분할 수 있다. 하지만 이 경우에도 각 테이블은 각자의 패턴(군)을 지니고 있음을 기억하자. 데이터 중복 제거는 반복적 접근법을 요구하기 때문에, 당신은 팀원들이 가장 리스크가 낮은 테이블의 툴과 프로세스에 익숙해지도록 해야 할 것이다. ‘가장 리스크가 낮은'이란 표현이 지니는 의미는 매우 가변적이지만, 사례 혹은 활동은 최선의 후보로 제시되는 경우가 일반적이다. 이들로 향해지는 타 기록의 수가 가장 적은 사례 혹은 활동을 의미하는 경향이 있기 때문이다.


X