Offcanvas

How To / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스 / 신기술|미래 / 애플리케이션 / 자기계발

익스피디아의 머신러닝 "10년 전부터 우리의 심장"

2016.08.17 Scott Carey  |  Computerworld UK
모든 이들이 머신러닝에 대해 떠들고 있을 때 익스피디아는 이미 10여 년 전부터 조용히 이를 이용해왔다.


Credit: Flickr Creative Commons/Alec Wilson

현재 머신러닝은 가트너 하이프 곡선의 정점에 다다랐지만, 여행 비교검색 업체인 익스피디아(Expedia)는 10여 년 전부터 자체 핵심 비즈니스에 머신러닝을 이용하고 있다. 익스피디아는 항공권 검색을 넘어 트리바고(Trivago), 호텔닷컴(Hotels.com) 등 여행 브랜드만 10여 개 이상 자회사로 보유하고 있다.

익스피디아 글로벌 제품 부사장 데이비드 플라이슈만은 "그러나 익스피디아의 심장은 언제나 머신러닝이었다"고 말했다. 항공권 검색 결과를 전달하는 사업은 막대한 컴퓨팅 파워를 필요로 하므로 그 대안으로 머신러닝을 사용했다는 것이다.

예를 들어 항공 여행일정표와 스케줄은 끊임없이 바뀐다. 따라서 익스피디아는 독자적인 BFS(best fare search)를 항상 새롭게 학습해 적용한다. 플라이슈만은 "익스피디아 항공권 검색시간은 평균 3초다. 사용자의 질의에 대한 결과를 전달하는데 3초가 걸린다는 뜻이다. 이 3초 동안 평균 1만 6,000건의 항공 예약 상황을 가격 또는 시간대 별로 검색해 그 결과를 보여준다"고 말했다.

이어 "주말에 익스피디아의 팀은 하나의 질의에 대해 이틀 동안 BFS를 실행하도록 한다. 예를 들어, 미국의 시애틀과 애틀랜타 간 왕복 여행이라는 질의를 던져놓고 주말을 보낸 후, 월요일 출근하면 이 알고리듬은 엄청나게 빠른 속도로 결과를 보여준다"라고 설명했다.

이처럼 익스피디아의 알고리듬은 머신러닝팀에 의해 항상 테스트되고 수정된다. 이 알고리듬의 서로 다른 다양한 버전과 튜닝을 통해 수정한 것을 테스트한다. 또한 서로 다른 버전의 전체 편향을 시도하고 해당 결과물을 보며, 더 좋은 결과물을 요구한다. 플라이슈만은 "더 나은 결과를 제공하면 사람들이 더 많은 항공권을 구매한다는 전제에 대해 테스트를 했고 그에 따른 성과를 확인했다"고 말했다.

익스피디아의 다음 도전
플라이슈만과 그의 팀의 차세대 프로젝트는 바로 자연어 검색 처리다. 근본적으로 이는 '질의에 대한 올바른 결과를 전달한다'는 익스피디아의 근본 목적으로 돌아온다. 이 질의는 사용자의 일정, 목적, 가격 범위와 같은 것이 될 수도 있고, 또는 “나는 이번 주말에 좋은 곳으로 떠나고 싶어”와 같은 자연어 질의가 될 수 있다.

플라이슈만은 "익스피디아의 목표는 여행객 질문에 대답하는 것이며 발견한 문제를 해결하기 위해 머신러닝을 사용한다. 지난 수년간 익스피디아는 자연어 처리에 대해 상당히 많은 기술을 쌓았다. 표준 여행 검색 프레임워크가 모바일 기기에서는 그다지 좋지 않다는 것도 확인했다"고 말했다.

결국 최종적인 목표는 개인화다. 사용자의 선호와 여행 습관을 학습할 수 있을까? 구매 절차 단계를 단축시킬 수 있을까? 같은 문제에 대해 머신러닝 알고리듬을 통해 답을 찾겠다는 것이다. 적어도 현 시점에서 익스피디아는 사용자가 통로쪽 좌석을 좋아하는지 여부보다 구매 프로세스를 최적화하는 것이 더 중요하다고 보고 있다.

머신러닝 전문가를 키우는 방법
익스피디아 머신러닝 팀에는 데이터 과학자를 포함해 700명 가량이 일하고 있다. 업체는 데이터과학자를 채용할 때 문제 해결 능력을 가장 중요하게 봤다. 플라이슈만은 "사람은 코드가 아니다. 중요한 것은 고객 문제를 이해한다는 것이다"라고 말했다.

이 말은 익스피디아 데이터과학 책임자 누노 카스트로의 언급을 통해 이해할 수 있다. 그는 "(데이터과학자는) 상업적인 측면에서 기업을 이해하고 기업 내에서 적절한 관계를 창출하는 사람이 더 성공할 수 있다"고 말한 바 있다.

익스피디아 머신러닝 팀은 기술전문가와 제품관리자, UX 디자이너 등으로 구성돼 있다. 머신러닝 전문가는 그들의 핵심 문제를 해결하는 사람으로, 익스피디아는 그들이 사용하는 툴이나, 그들이 문제에 접근하는 방법에 대해 지시하지 않는다.

카스트로는 "일반적으로 어떤 행위의 원인을 설명하는 것이 최종 목표다. 그러나 불행하게도 다른 분야와는 달리 데이터 과학에서는 레시피가 없다. 종종 한 질문에 대한 올바른 해답을 발견하기 위해 노력하지 않고, 질문을 위한 질문을 파악하려고 노력하는 것도 이 때문이다"라고 말했다. editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.