2017.04.07

트럼프 캠프의 최고 데이터 과학자가 밝힌 '대선 승리 비결'

Nadia Cameron | CMO

지난 미국 대선에서 트럼프 캠프와 클린턴 캠프 모두 데이터를 분석하고 선거 운동 전략을 수립했다. 이 두 캠프의 데이터 분석에는 어떤 차이가 있었을까? 선거를 불과 6개월 남겨 두고 트럼프 캠프에 합류한 최고 데이터 과학자에게 그 답을 들어봤다. 



트럼프 정부의 최고 데이터 과학자인 매트 오츠코브스키는 지난 미국 대선 과정에 얻은 교훈 중 기업에 전하고 싶은 한 가지가 있다. 기업에도 폐쇄형 플랫폼인 ‘월드 가든(Walled Garden)'이 필요하다는 것이다.

최근 ADMA 데이터 데이(ADMA Data Day)에 참석해 <CMO>가 독점 인터뷰한 캠브리지 애널리티카(Cambridge Analytica)의 데이터 과학자인 오츠코브스키는 "모든 기업이 데이터와 모델링에 '월드 가든' 방식을 도입할 필요가 있다. 이는 구글과 페이스북이 오랜 기간 '마스터'한 접근법이다. 그들은 자신의 풀에서 데이터 아웃풋을 꺼내 당신에게 주지 않는다. 당신은 마케팅을 통해 이를 구입해야 한다. 대형 소비재 브랜드들은 퍼스트 파티 데이터 소스로 구성된 독자적인 '월드 가든'을 구축해야 한다"고 말했다.

이와는 대조적으로 오츠코브스키가 디지털 마케팅 지형에서 사라질 것으로 확신하는 한 가지가 있다. 다름 아닌 프로그래매틱 광고(Programmatic Advertising)다.

그는 "프로그래매틱 미디어 광고는 사라질 것"이라며 트럼프 대선 캠프는 디지털 예산의 절반 이상을 페이스북에 사용했다고 강조했다.

오츠코브스키는 "광고를 위해, 웹사이트의 250x250 공간을 구입하는 것은 이제 어리석은 일이다. 방문자가 클릭할 확률보다 상어에 물릴 확률이 더 높기 때문이다. 우리는 사용자 경험에 모든 초점이 맞춰진 네이티브 광고로 이동하고 있다. 이제 프로그래매틱 광고는 효과가 없다"고 주장했다.

내부에 퍼스트 파티 데이터 소스를 구축해야 고객 경험을 구현할 수 있다. 오츠코브스키는 "온라인은 물론 오프라인에도 적용되는 이야기다. 그래야 더 효과적으로 정확하게 고객을 파악할 수 있다"며 다음과 같이 말을 이었다.

"나는 고객사에게 '사냥을 배우고 싶으면 동물원이 아닌 정글을 방문하라!'는 말을 자주 한다. 그런데 고객사 중에는 동물원에서 사냥하는 기업이 많다. 모두 동일한 정보와 데이터를 사용한다는 의미다. 이는 무의미한 정보들이다. 코카콜라와 펩시가 X라는 데이터를 구입해, 이를 토대로 미디어 광고를 결정했다고 가정하자. 이 경우, 차별화가 없다. 자신만의 데이터를 배양해야 한다. 자신만의 조사를 수행해야 한다."

트럼프 선거본부의 데이터 활용 방법
캠브리지 애널리티카는 미국 대선이 6개월이 채 남지 않았을 때 트럼프 선거 본부에 합류했다. 이 빅데이터 컨설팅 회사는 정치 캠페인은 물론 기업과 국방 관련 사업에도 참여한 바 있다.

오츠코브스키는 '강요된 혁신(Forced Innovation)'이라는 특징 때문에 정치 캠페인은 대단히 수직적이라고 설명했다. 그는 "정치 캠페인처럼 출발점이 명확한 캠페인은 없다. 6개월~2년을 기한으로 여러 사람으로 구성된 조직을 구성해야 하고, 수억 달러를 지출해야 한다. 또 '끝나는 날'과 목표가 명확하다. 51%의 '시장 점유율'을 달성하는 것이 목표다"고 말했다.

트럼프 선거본부에서 캠브리지 애널리티카가 가장 먼저 한 일은 여러 다른 소스에서 데이터를 수집해 처리하고, 대조하며, 중복을 제거할 수 있는 적절한 데이터베이스 인프라를 구축하는 것이었다.

이후 3가지 목표에 집중하기 시작했다. '펀드레이징(자본 유치)', '소속 후보자를 지지하도록 유권자를 설득하는 것', '투표율을 높이는 것(미국에서는 GOTV라고 함)'이 바로 그 3가지 목표였다.

캠브리지 애널리티카는 3가지의 데이터를 이용했다. 첫째 유권자가 그동안 투표했던 정당 같은 ‘정치 데이터’다. 둘째 엑스페리안(Experian), 액시엄(Axiom), 기타 소스를 통해 공개 입수할 수 있는 소비자 구매 트렌드 데이터, 인구통계학적 데이터, 지리적 데이터 등 '공개 데이터'다. 마지막으로 여론 조사, 시장 조사, 모델링 결과에 토대로 계속 증가시키는 퍼스트 파티 데이터다. 미국 성인 1명당 1,000~5,000개의 데이터 포인트를 사용했다.

오츠코브스키는 "보유한 데이터의 종류와 품질이 가장 중요하다. 데이터 분석과 인공지능, 머신러닝도 좋다. 이것들은 계속 발전하고 있다. 그러나 무엇보다 중요한 것은 좋은 데이터이다"고 강조했다. 그는 "유수 대기업을 지원하면서 터득한 교훈 중 하나는 이들이 아주 기초적인 문제에 직면해 있다는 것이다. 데이터 사일로(고립)'가 문제가 된다. 이로 인해 특정 팀이 다른 팀의 데이터에 접근할 수 없다. 기업 내부 절차가 지나치게 복잡해 발생하는 문제다. 우리는 조기에 아주 간단히 문제를 해결한다. 데이터를 한 장소로 통합하고, 중복을 제거하고, 분석을 위해 모델링을 하는 방법이다"고 설명했다.

오즈코브스키는 트럼프 선거본부의 경우, 후보자의 특성을 토대로 데이터 과학에 접근해야 했다고 말했다.
 


그는 "단 한 개의 트윗으로 유권자의 태도를 바꿀 수 있는 후보자는 없다. 따라서 물결 효과 추적 측면에서, 아주 반응성이 높은 데이터 프로그램을 구축해야 했다. 무슨 일이 발생했을 때, 이것이 유권자에 어떤 영향을 초래하는지 확인해야 했다"고 설명했다.

트럼프 선거본부에서 사용한 퍼스트 파티 데이터 세트의 초석은 연구와 여론 조사였다. 팀은 대선 기간 17개 격전지 주를 대상으로 80만 회의 실시간, 온라인 조사를 했다. 그 결과를 토대로 데이터를 모델링했다. 그리고 세그멘테이션과 미디어 구매에 모델링 결과를 활용했다. 그다음, 이러한 활동에서 획득한 인사이트를 머신에 주입했다.

오츠코브스키는 "순환적인 방식을 적용했다. 현장 조사를 하고, 데이터를 이용해 모델링을 하고, 이 모델로 미디어 구매를 결정하고, 이후 이를 바탕으로 더 많은 조사를 수행했다. 폐쇄된 고리 같은 프로세스였다"고 설명했다.

이런 과정을 통해 270표를 효과적으로 확보할 방법을 보여주는 '패스 투 빅토리(Path to Victory)' 계산기, '시티 투 비지트(Cities to Visit)' 계산기 같은 도구를 개발했다.

오츠코브스키는 "격전지인 17개 주의 모든 도시에 순위를 매겼다. 그리고 트럼프가 반드시 방문해야 하는 도시를 정해, 여기에 초점을 맞췄다. 선거 마지막 1~2개월 동안 트럼프의 방문지가 불규칙했다고 생각하는 사람들이 많다. 그러나 '지능적'으로 방문지를 선택했다. 단지 이를 말하지 않았을 뿐이다"고 말했다.

 




2017.04.07

트럼프 캠프의 최고 데이터 과학자가 밝힌 '대선 승리 비결'

Nadia Cameron | CMO

지난 미국 대선에서 트럼프 캠프와 클린턴 캠프 모두 데이터를 분석하고 선거 운동 전략을 수립했다. 이 두 캠프의 데이터 분석에는 어떤 차이가 있었을까? 선거를 불과 6개월 남겨 두고 트럼프 캠프에 합류한 최고 데이터 과학자에게 그 답을 들어봤다. 



트럼프 정부의 최고 데이터 과학자인 매트 오츠코브스키는 지난 미국 대선 과정에 얻은 교훈 중 기업에 전하고 싶은 한 가지가 있다. 기업에도 폐쇄형 플랫폼인 ‘월드 가든(Walled Garden)'이 필요하다는 것이다.

최근 ADMA 데이터 데이(ADMA Data Day)에 참석해 <CMO>가 독점 인터뷰한 캠브리지 애널리티카(Cambridge Analytica)의 데이터 과학자인 오츠코브스키는 "모든 기업이 데이터와 모델링에 '월드 가든' 방식을 도입할 필요가 있다. 이는 구글과 페이스북이 오랜 기간 '마스터'한 접근법이다. 그들은 자신의 풀에서 데이터 아웃풋을 꺼내 당신에게 주지 않는다. 당신은 마케팅을 통해 이를 구입해야 한다. 대형 소비재 브랜드들은 퍼스트 파티 데이터 소스로 구성된 독자적인 '월드 가든'을 구축해야 한다"고 말했다.

이와는 대조적으로 오츠코브스키가 디지털 마케팅 지형에서 사라질 것으로 확신하는 한 가지가 있다. 다름 아닌 프로그래매틱 광고(Programmatic Advertising)다.

그는 "프로그래매틱 미디어 광고는 사라질 것"이라며 트럼프 대선 캠프는 디지털 예산의 절반 이상을 페이스북에 사용했다고 강조했다.

오츠코브스키는 "광고를 위해, 웹사이트의 250x250 공간을 구입하는 것은 이제 어리석은 일이다. 방문자가 클릭할 확률보다 상어에 물릴 확률이 더 높기 때문이다. 우리는 사용자 경험에 모든 초점이 맞춰진 네이티브 광고로 이동하고 있다. 이제 프로그래매틱 광고는 효과가 없다"고 주장했다.

내부에 퍼스트 파티 데이터 소스를 구축해야 고객 경험을 구현할 수 있다. 오츠코브스키는 "온라인은 물론 오프라인에도 적용되는 이야기다. 그래야 더 효과적으로 정확하게 고객을 파악할 수 있다"며 다음과 같이 말을 이었다.

"나는 고객사에게 '사냥을 배우고 싶으면 동물원이 아닌 정글을 방문하라!'는 말을 자주 한다. 그런데 고객사 중에는 동물원에서 사냥하는 기업이 많다. 모두 동일한 정보와 데이터를 사용한다는 의미다. 이는 무의미한 정보들이다. 코카콜라와 펩시가 X라는 데이터를 구입해, 이를 토대로 미디어 광고를 결정했다고 가정하자. 이 경우, 차별화가 없다. 자신만의 데이터를 배양해야 한다. 자신만의 조사를 수행해야 한다."

트럼프 선거본부의 데이터 활용 방법
캠브리지 애널리티카는 미국 대선이 6개월이 채 남지 않았을 때 트럼프 선거 본부에 합류했다. 이 빅데이터 컨설팅 회사는 정치 캠페인은 물론 기업과 국방 관련 사업에도 참여한 바 있다.

오츠코브스키는 '강요된 혁신(Forced Innovation)'이라는 특징 때문에 정치 캠페인은 대단히 수직적이라고 설명했다. 그는 "정치 캠페인처럼 출발점이 명확한 캠페인은 없다. 6개월~2년을 기한으로 여러 사람으로 구성된 조직을 구성해야 하고, 수억 달러를 지출해야 한다. 또 '끝나는 날'과 목표가 명확하다. 51%의 '시장 점유율'을 달성하는 것이 목표다"고 말했다.

트럼프 선거본부에서 캠브리지 애널리티카가 가장 먼저 한 일은 여러 다른 소스에서 데이터를 수집해 처리하고, 대조하며, 중복을 제거할 수 있는 적절한 데이터베이스 인프라를 구축하는 것이었다.

이후 3가지 목표에 집중하기 시작했다. '펀드레이징(자본 유치)', '소속 후보자를 지지하도록 유권자를 설득하는 것', '투표율을 높이는 것(미국에서는 GOTV라고 함)'이 바로 그 3가지 목표였다.

캠브리지 애널리티카는 3가지의 데이터를 이용했다. 첫째 유권자가 그동안 투표했던 정당 같은 ‘정치 데이터’다. 둘째 엑스페리안(Experian), 액시엄(Axiom), 기타 소스를 통해 공개 입수할 수 있는 소비자 구매 트렌드 데이터, 인구통계학적 데이터, 지리적 데이터 등 '공개 데이터'다. 마지막으로 여론 조사, 시장 조사, 모델링 결과에 토대로 계속 증가시키는 퍼스트 파티 데이터다. 미국 성인 1명당 1,000~5,000개의 데이터 포인트를 사용했다.

오츠코브스키는 "보유한 데이터의 종류와 품질이 가장 중요하다. 데이터 분석과 인공지능, 머신러닝도 좋다. 이것들은 계속 발전하고 있다. 그러나 무엇보다 중요한 것은 좋은 데이터이다"고 강조했다. 그는 "유수 대기업을 지원하면서 터득한 교훈 중 하나는 이들이 아주 기초적인 문제에 직면해 있다는 것이다. 데이터 사일로(고립)'가 문제가 된다. 이로 인해 특정 팀이 다른 팀의 데이터에 접근할 수 없다. 기업 내부 절차가 지나치게 복잡해 발생하는 문제다. 우리는 조기에 아주 간단히 문제를 해결한다. 데이터를 한 장소로 통합하고, 중복을 제거하고, 분석을 위해 모델링을 하는 방법이다"고 설명했다.

오즈코브스키는 트럼프 선거본부의 경우, 후보자의 특성을 토대로 데이터 과학에 접근해야 했다고 말했다.
 


그는 "단 한 개의 트윗으로 유권자의 태도를 바꿀 수 있는 후보자는 없다. 따라서 물결 효과 추적 측면에서, 아주 반응성이 높은 데이터 프로그램을 구축해야 했다. 무슨 일이 발생했을 때, 이것이 유권자에 어떤 영향을 초래하는지 확인해야 했다"고 설명했다.

트럼프 선거본부에서 사용한 퍼스트 파티 데이터 세트의 초석은 연구와 여론 조사였다. 팀은 대선 기간 17개 격전지 주를 대상으로 80만 회의 실시간, 온라인 조사를 했다. 그 결과를 토대로 데이터를 모델링했다. 그리고 세그멘테이션과 미디어 구매에 모델링 결과를 활용했다. 그다음, 이러한 활동에서 획득한 인사이트를 머신에 주입했다.

오츠코브스키는 "순환적인 방식을 적용했다. 현장 조사를 하고, 데이터를 이용해 모델링을 하고, 이 모델로 미디어 구매를 결정하고, 이후 이를 바탕으로 더 많은 조사를 수행했다. 폐쇄된 고리 같은 프로세스였다"고 설명했다.

이런 과정을 통해 270표를 효과적으로 확보할 방법을 보여주는 '패스 투 빅토리(Path to Victory)' 계산기, '시티 투 비지트(Cities to Visit)' 계산기 같은 도구를 개발했다.

오츠코브스키는 "격전지인 17개 주의 모든 도시에 순위를 매겼다. 그리고 트럼프가 반드시 방문해야 하는 도시를 정해, 여기에 초점을 맞췄다. 선거 마지막 1~2개월 동안 트럼프의 방문지가 불규칙했다고 생각하는 사람들이 많다. 그러나 '지능적'으로 방문지를 선택했다. 단지 이를 말하지 않았을 뿐이다"고 말했다.

 


X