AI / 마케팅 / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스 / 인문학|교양
지난 미국 대선에서 트럼프 캠프와 클린턴 캠프 모두 데이터를 분석하고 선거 운동 전략을 수립했다. 이 두 캠프의 데이터 분석에는 어떤 차이가 있었을까? 선거를 불과 6개월 남겨 두고 트럼프 캠프에 합류한 최고 데이터 과학자에게 그 답을 들어봤다.
트럼프 정부의 최고 데이터 과학자인 매트 오츠코브스키는 지난 미국 대선 과정에 얻은 교훈 중 기업에 전하고 싶은 한 가지가 있다. 기업에도 폐쇄형 플랫폼인 ‘월드 가든(Walled Garden)'이 필요하다는 것이다.
최근 ADMA 데이터 데이(ADMA Data Day)에 참석해 <CMO>가 독점 인터뷰한 캠브리지 애널리티카(Cambridge Analytica)의 데이터 과학자인 오츠코브스키는 "모든 기업이 데이터와 모델링에 '월드 가든' 방식을 도입할 필요가 있다. 이는 구글과 페이스북이 오랜 기간 '마스터'한 접근법이다. 그들은 자신의 풀에서 데이터 아웃풋을 꺼내 당신에게 주지 않는다. 당신은 마케팅을 통해 이를 구입해야 한다. 대형 소비재 브랜드들은 퍼스트 파티 데이터 소스로 구성된 독자적인 '월드 가든'을 구축해야 한다"고 말했다.
이와는 대조적으로 오츠코브스키가 디지털 마케팅 지형에서 사라질 것으로 확신하는 한 가지가 있다. 다름 아닌 프로그래매틱 광고(Programmatic Advertising)다.
그는 "프로그래매틱 미디어 광고는 사라질 것"이라며 트럼프 대선 캠프는 디지털 예산의 절반 이상을 페이스북에 사용했다고 강조했다.
오츠코브스키는 "광고를 위해, 웹사이트의 250x250 공간을 구입하는 것은 이제 어리석은 일이다. 방문자가 클릭할 확률보다 상어에 물릴 확률이 더 높기 때문이다. 우리는 사용자 경험에 모든 초점이 맞춰진 네이티브 광고로 이동하고 있다. 이제 프로그래매틱 광고는 효과가 없다"고 주장했다.
내부에 퍼스트 파티 데이터 소스를 구축해야 고객 경험을 구현할 수 있다. 오츠코브스키는 "온라인은 물론 오프라인에도 적용되는 이야기다. 그래야 더 효과적으로 정확하게 고객을 파악할 수 있다"며 다음과 같이 말을 이었다.
"나는 고객사에게 '사냥을 배우고 싶으면 동물원이 아닌 정글을 방문하라!'는 말을 자주 한다. 그런데 고객사 중에는 동물원에서 사냥하는 기업이 많다. 모두 동일한 정보와 데이터를 사용한다는 의미다. 이는 무의미한 정보들이다. 코카콜라와 펩시가 X라는 데이터를 구입해, 이를 토대로 미디어 광고를 결정했다고 가정하자. 이 경우, 차별화가 없다. 자신만의 데이터를 배양해야 한다. 자신만의 조사를 수행해야 한다."
트럼프 선거본부의 데이터 활용 방법
캠브리지 애널리티카는 미국 대선이 6개월이 채 남지 않았을 때 트럼프 선거 본부에 합류했다. 이 빅데이터 컨설팅 회사는 정치 캠페인은 물론 기업과 국방 관련 사업에도 참여한 바 있다.
오츠코브스키는 '강요된 혁신(Forced Innovation)'이라는 특징 때문에 정치 캠페인은 대단히 수직적이라고 설명했다. 그는 "정치 캠페인처럼 출발점이 명확한 캠페인은 없다. 6개월~2년을 기한으로 여러 사람으로 구성된 조직을 구성해야 하고, 수억 달러를 지출해야 한다. 또 '끝나는 날'과 목표가 명확하다. 51%의 '시장 점유율'을 달성하는 것이 목표다"고 말했다.
트럼프 선거본부에서 캠브리지 애널리티카가 가장 먼저 한 일은 여러 다른 소스에서 데이터를 수집해 처리하고, 대조하며, 중복을 제거할 수 있는 적절한 데이터베이스 인프라를 구축하는 것이었다.
이후 3가지 목표에 집중하기 시작했다. '펀드레이징(자본 유치)', '소속 후보자를 지지하도록 유권자를 설득하는 것', '투표율을 높이는 것(미국에서는 GOTV라고 함)'이 바로 그 3가지 목표였다.
캠브리지 애널리티카는 3가지의 데이터를 이용했다. 첫째 유권자가 그동안 투표했던 정당 같은 ‘정치 데이터’다. 둘째 엑스페리안(Experian), 액시엄(Axiom), 기타 소스를 통해 공개 입수할 수 있는 소비자 구매 트렌드 데이터, 인구통계학적 데이터, 지리적 데이터 등 '공개 데이터'다. 마지막으로 여론 조사, 시장 조사, 모델링 결과에 토대로 계속 증가시키는 퍼스트 파티 데이터다. 미국 성인 1명당 1,000~5,000개의 데이터 포인트를 사용했다.
오츠코브스키는 "보유한 데이터의 종류와 품질이 가장 중요하다. 데이터 분석과 인공지능, 머신러닝도 좋다. 이것들은 계속 발전하고 있다. 그러나 무엇보다 중요한 것은 좋은 데이터이다"고 강조했다. 그는 "유수 대기업을 지원하면서 터득한 교훈 중 하나는 이들이 아주 기초적인 문제에 직면해 있다는 것이다. 데이터 사일로(고립)'가 문제가 된다. 이로 인해 특정 팀이 다른 팀의 데이터에 접근할 수 없다. 기업 내부 절차가 지나치게 복잡해 발생하는 문제다. 우리는 조기에 아주 간단히 문제를 해결한다. 데이터를 한 장소로 통합하고, 중복을 제거하고, 분석을 위해 모델링을 하는 방법이다"고 설명했다.
오즈코브스키는 트럼프 선거본부의 경우, 후보자의 특성을 토대로 데이터 과학에 접근해야 했다고 말했다.