Offcanvas

비즈니스|경제 / 빅데이터 | 애널리틱스

‘도착 승객 예측부터 이메일 자동 분류까지’ 에티하드 항공의 데이터이쿠 플랫폼 활용기

2022.12.21 Arun Shankar  |  CIO
에티하드 항공(Etihad Airlines)은 데이터이쿠(Dataiku)의 엔드투엔드 머신러닝 플랫폼을 이용해 비용을 절감하고 생산성을 향상하는 등 팬데믹 기간 찾아온 대위기를 무사히 넘겼다. 
 
ⓒGetty Images Bank

항공운송 산업은 팬데믹 기간 전례 없는 위기를 겪었다. 그럼에도 아랍에미리트의 항공사 에티하드 항공(Etihad Airlines)은 데이터 과학을 활용해 생산성을 늘리고 비용을 절감해냈다. 아부다비에 본사를 둔 항공사는 데이터 레이크와 AI 중심의 데이터 애널리틱스 도구를 사용해 직원 배치, 승객 및 고객 지원을 최적화할 방법을 찾았다. 

에티하드 항공에서 전략, 관리 및 포트폴리오 거버넌스 책임자를 맡고 있는 림 알리아 라바 박사는 “디지털 전환을 기회로 삼아 효율성과 민첩성을 크게 신장할 수 있었다. 중견 항공사로서 입지를 재검토하는 계기가 됐고, 그에 따라 거버넌스와 사고 방식을 바꾸기로 했다”라고 말했다. 

에티하드는 클라우데라 데이터 플랫폼으로 데이터 과학 프로젝트를 시작했다. 데이터 레이크를 구축하기 위해 클라우드로 이전했으나 데이터를 효과적으로 분석하기에는 비효율적이라는 점을 깨달았다. 변화가 필요했다. 에티하드 엔터프라이즈 데이터 관리 책임자 마틴 해머는 “회사는 디지털 전환 과정에 있으며, 데이터 전략은 전사적으로 가용할 수 있는 모든 데이터를 활용해 부서 간 사일로를 무너뜨려 모든 비즈니스 프로세스에 쓰일 수 있도록 하는 것이다”라고 말했다. 
 

데이터 과학 플랫폼에서 통합 

에티하드는 처음부터 데이터 모델링과 애닐리틱스를 통합하기로 결정하고 이를 위해 데이터이쿠의 엔드투엔드 머신러닝 플랫폼을 선택했다. 데이터이쿠 중동 및 터키 지사장 싯다르트 바티아는 “에티하드는 열심히 데이터를 수집하고 있었지만 여기서 인사이트를 뽑아내고 싶어했다. 이를 위해서는 데이터 표준화가 우선이었다”라고 말했다. 

에티하드가 글로벌 항공사인만큼 데이터 관리자들은 여러 국가에서 일한다. 데이터이쿠는 서버 및 브라우저 기반 애플리케이션으로서 여기저기 분산되어 있는 팀이 원격으로 일할 수 있도록 지원한다. 에티하드의 데이터 과학 매니저 탈랄 무프티는 데이터이쿠의 로우코드 시각화 툴 덕분에 비즈니스 리더들이 데이터 과학자들과 더 원활히 소통할 수 있었다고 전했다. 이에 더해 데이터 애널리스트은 데이터 시각화 역량도 키우게 됐다. 

에티하드는 데이터 모델을 매우 신속하게 구축, 예약 및 자동화하길 원했다. 절감한 비용을 명확히 입증할 방법도 필요했다. 회사는 먼저 당장 해볼 수 있는 사용 사례부터 시도해봤다. 그러고 나서 제일 큰 장기적 효과를 낼 사용 사례를 추가로 개발하려는 계획이었다. 그 결과 재정적 이점과 비용 절감이 제일 큰 원동력이 됐다. 이는 모두 팬데믹 이전에 일어난 일이지만 막상 팬데믹이 닥치자 빛을 발휘했다. 
 

도착 여객수 예측하기 

대표적인 데이터 활용 사례 중 하나는 도착 여객 수를 예측하는 것이었다. 그래야 현장 직원을 더 효율적으로 배치할 수 있었다. 항공 운항 이동에는 많은 인력이 투입되며, 이 중 일부는 정직원, 일부는 계약 직원이다. 체크인 담당 직원과 수하물 취급 관리 직원도 있다. 이러한 인력이 정확히 언제 얼마나 필요한지 알 수 없어 에티하드는 예측 모델을 만들고자 했다. 모델의 예측 기간은 총 14일로, 30분의 간격으로 도착 4시간 전부터 필요한 인력을 계산했다. 

에티하드는 데이터이쿠 플랫폼으로 도착하는 승객 수를 모델링하고 예측하는 시스템을 구축했다. 공항 관리자들이 필요한 직원의 수나 필요한 시간대를 정확히 파악할 수 있게 됐으며, 외부 공급업체와도 더 나은 계약 협상을 따낼 수 있었다. 
 

NLP를 사용해 이메일 자동 응대

또 다른 활용 사례는 문의 이메일이었다. 에티하드 CRM 시스템은 단지 들어오는 이메일을 기록하고 있었을 뿐 필요한 것은 이 수많은 이메일을 분류해 관련 담당자에게 전달하는 일이었다. 바티아는 “고객은 항상 담당자와 직접 소통하길 원하지만 이는 보통 일이 아니다. 이메일을 자동으로 분류해 관련 담당자에게 전달하는 시스템이 필요했다”라고 말했다. 

데이터이쿠는 NLP(자연어 처리)로 이메일을 인식해 자동으로 분류하는 시스템을 개발해냈다. 자연어 처리는 컴퓨터 시스템에 구어나 텍스트를 이해하고 결정할 수 있는 능력을 제공한다. 자연어 알고리즘은 문서나 이메일의 주요 요점을 자동으로 요약할 수 있다. 또한 이러한 알고리즘은 정해진 범주에 따라 텍스트를 분류하고 정보를 재구성해 이메일을 필터링하는 데 쓰일 수 있다. 

데이터이쿠의 자연어 처리 모델은 이메일을 자동으로 분석해 CRM 시스템에 자동으로 고객 케이스를 생성한다. 구체적으로 수신되는 고객 이메일은 데이터이쿠의 API를 통해 자연어 처리 모델과 연결된다. 데이터 과학 매니저 탈랄 무프티는 “이 시스템이 장기적으로 상당한 비용을 절감해줄 것으로 보인다”라고 말했다. 
 

데이터 드리프트 막기 

데이터 과학 프로젝트를 하다보면 나중에 발생하는 문제 중 하나가 데이터 드리프트(data drift) 현상이다. 들어오는 데이터가 애초에 데이터 모델을 생성했을 때 쓰였던 데이터와 점점 달라지면 기존 데이터 모델은 더 이상 효력을 발휘하지 못한다. 바티아는 이런 현상이 일어나면 “기존 모델의 예측 역량이 현저히 떨어진다”라고 말했다. 하지만 데이터이쿠는 이럴 때 데이터 모델을 재개발한다. 새로운 데이터에 맞는 모델을 새로 학습시켜 새로운 모델을 생성한다고 바티아는 전했다. 

에티하드 항공 관계자들은 모두 데이터이쿠 플랫폼을 몇몇 사용 사례에 적용해 본 결과 회사가 상당히 비용을 절감했으며 앞으로도 계속 사용할 의사가 있다고 밝혔다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.