Offcanvas

AI / 머신러닝|딥러닝

AI도 과하면 독, ‘딱 맞는 해법’은 따로 있다

2022.01.25 Maria Korolov  |  CIO
AI 프로젝트를 성공시키려면 비즈니스 가치, 학습용 데이터, 문화적 준비가 필수다. 이 3가지가 모두 없다면 기존 솔루션이 더 적합할 수도 있다.

인공지능(AI) 도입이 증가하고 있다. 최근 발표된 맥킨지의 설문조사 결과에 따르면 55%의 기업이 적어도 1개 부서에서 인공지능을 사용하고 있으며, 27%는 이자 및 세전 수익의 최소 5%를 AI를 통해 비용 절감의 형태로 얻고 있는 것으로 나타났다.

AI가 (관련된) 거의 모든 산업을 극적으로 변화시킬 것이기 때문에 벤더와 기업들이 가능한 모든 곳에 AI를 배포할 기회를 찾고 있다는 건 놀라운 일은 아니다. 하지만 모든 프로젝트가 AI의 이점을 누릴 수 있는 건 아니며, 적절하지 않은 곳에 AI를 도입하면 시간과 비용을 낭비할 뿐만 아니라 직원, 고객, 기업 리더가 고배를 마실 수 있다.

어떤 프로젝트가 AI에 적합한지를 판단하는 핵심 요소는 ▲비즈니스 가치, ▲학습용 데이터의 가용성, ▲변화에 따른 문화적 준비 수준이다. 인공지능 이니셔티브가 매몰 비용이 되기 전에, 제안된 AI 프로젝트에 이러한 요소가 부합하는지 확인하는 방법을 살펴본다.
 
ⓒGetty Images

가장 간단한 솔루션부터 시작하라
전 세계 90여 개국에 1만 8,000개 이상의 매장을 보유하고 있는 피자 체인점 도미노의 데이터 과학 및 AI 부문 관리자 잭 프라고소는 특히 데이터 과학자가 AI 우선 접근법을 선호한다고 말했다. 하지만 모든 곳에 AI를 적용할 순 없다고 그는 지적했다. 

전통적인 산업이지만 도미노는 변화를 추진해왔다. 특히 팬데믹 기간에는 더욱더 그랬다. 현재 고객들은 13가지 디지털 방식으로 피자를 주문할 수 있으며, 2020년 도미노 매출의 70% 이상은 디지털 주문에서 나왔다. 이는 AI의 가능성을 입증할 수 있는 많은 기회를 열어줬다.

프라고소는 “도미노가 AI를 도입할 때의 핵심은 간단한 접근방식을 취하는 것이었다”라며, “단순한 솔루션이 더 빠르게 실행되고 더 나은 성과를 보여주기 때문에 이를 비즈니스 파트너에게 설명할 수 있다. 설명 가능성이 중요하다. 대부분의 사람들이 도구와 방법을 이해하면 도입하기가 더 쉬워진다”라고 말했다.

접근법 자체는 간단하다. 해결해야 하는 문제가 있을 때 도미노는 가장 단순하고 전통적인 솔루션을 살펴본 다음, 거기서 시작해도 충분한지 추가적으로 필요한 기술이 있는지 확인한다고 그는 언급했다. 예를 들면 피자를 요리하고 포장하는 시간을 예측하는 건 간단하다. 프라고소는 “운영 리서치에서 단순하고 전통적인 솔루션을 찾는다. 앞서 언급한 사례에서는 타이머를 쓰면 된다. 하지만 이미지 인식이나 자연어 처리 등 AI로만 해결할 수 있는 문제가 있다”라고 전했다.

이를테면 작년에 도미노는 모든 피자 매장에서 피자를 먹은 고객에게 보상을 제공하는 로열티 프로그램을 운영했다. 그는 “수백만 장의 다양한 피자 사진을 사용하여 피자 분류기를 개발하고 앱에 넣었다”라고 말했다. 해당 프로젝트는 2가지 종류의 비즈니스 가치를 제공했다. 첫째, CX가 개선됐다. 둘째, 도미노에서 피자 품질과 온도를 감지하는 데 쓸 수 있는 피자 이미지 콜렉션을 생성할 수 있었다. 

도미노가 진행한 더 실용적인 AI 이니셔티브는 피자 추적기의 정확성을 개선하는 프로젝트였다. 고객들이 음식을 픽업하기 위해 정확히 언제 매장을 방문해야 하는지, 음식 배달이 언제 도착하는지 알고 싶어 했기 때문이다. 도미노 피자 추적기의 기존 if-then 코딩에 머신러닝을 추가해 정확성이 100% 향상됐다고 프라고소는 설명했다.

아울러 이 모델을 구축할 때 도미노는 단순성을 우선시한다는 원칙을 고수했다. 그는 “첫 번째 버전은 단순 회귀 모델이었고 근접한 결과를 얻었다. 그다음 의사결정 트리 모델을 통해 더 많은 측면을 살펴볼 수 있었다. 그리고 의사결정 트리와 같은 변수를 포착할 수 있으면서 답을 더 신속하게 생성할 수 있는 신경망으로 전환했다. 웹 사이트에서의 신속한 고객 경험을 추구하고 있기 때문이다”라고 말했다.

젠팩트(Genpact)의 최고디지털책임자(CDO) 산자이 스리바스타바는 특히 기업들이 경험에 기초하여 지속적으로 개선되는 프로세스를 구축하려 할 때 머신러닝을 적용할 수 있다고 언급했다. 하지만 때로는 기본적인 통계 모델링에서 얻을 수 있는 간단한 상관관계만으로 충분할 때가 있다. 그는 “랜덤 포레스트 및 기타 통계 도구 키트를 중심으로 한 10년 전의 관행을 사용하면 ML옵스(MLOps)팀을 구성하는 것보다 더 빠르고 저렴하게 답을 얻을 수 있다. 훨씬 더 단순하고 훨씬 더 효과적인 기존 기법으로 돌아가야 할 때를 알아야 한다”라고 조언했다.

그는 AI가 해결책을 제시하긴 하지만 일반적으로 (AI를 도입하는 것이) 지나친 영역 중 하나가 바로 챗봇이라고 지적했다. 스리바스타바는 “일부 시나리오에서는 적합하다. 하지만 시나리오의 90%에서는 앞으로 나올 질문을 알 수 있다. 지난 3년 동안의 질문을 볼 수 있고, 모든 질문의 답을 알고 있기 때문이다. 결국 챗봇의 90%는 간단한 질의응답 쌍으로도 대체할 수 있다”라고 말했다.

과거 데이터: 미래 결과를 예측하는 AI의 핵심
모든 유한 데이터세트를 곡선에 맞출 수 있다. 예를 들면 작년의 로또 당첨 번호를 가지고 이를 완벽하게 예측할 수 있는 모델을 만들 수 있다. 하지만 이 모델은 여전히 미래를 예측할 수 없다. 기본적인 메커니즘이 완전히 무작위이기 때문이다.

팬데믹은 이런 일이 실제로 어떻게 일어나는지 보여주는 좋은 예였다. 이를테면 봉쇄조치가 공장 폐쇄로 이어질지 예측할 수 있는 방법이 없었다. 맥킨지의 AI 현황 조사(State of AI Survey) 보고서에 따르면 그 결과 기업들의 여러 부문에서 매출이 감소했다. 지난해 전략 및 기업 재무 부문에서 매출이 증가했다고 밝힌 응답자는 73%에 달했지만 올해에는 67%에 그쳤다. 그 차이는 공급망 관리에서 두드러졌다. 작년에는 72%가 이 부문에서 매출이 증가했다고 답했지만 올해는 54%에 불과했다.

ACP(Axiom Consulting Partners)의 파트너 돈차 캐롤은 “AI 또는 ML의 근본적인 특징은 이력을 활용해 정보를 제공한다는 것”이라며, “과거와 떼려야 뗄 수가 없다. AI는 역사가 반복될 가능성이 있는 상황에 적합하다”라고 말했다. 예를 들어 AI를 사용해 미래 수익을 예측한다고 할 때 매출은 예측할 수 없고, 통제할 수 없으며, 기업에 데이터가 없는 요인의 영향을 받는다. 그리고 이러한 요인 중 일부가 결과에 외부적인 영향을 미치는 경우 모델 전체가 무용지물이 될 수 있다고 그는 설명했다.

캐롤은 “이럴 땐 AI를 도입해서는 안 된다. 하나의 변수가 바뀌면 즉시 관련성이 없어지는 솔루션에 수십억 달러를 투자할 것인가?”라며, “AI는 다양한 시나리오를 모델링하거나 분명하지 않을 수 있는 인사이트를 드러내는 데 유용할 수 있다. 초점을 좁히면 성공할 가능성이 높아진다”라고 전했다. 

AI의 존재 자체가 시스템의 행동을 바꾸는 경우에도 AI는 적합하지 않다. 예를 들면 AI를 사용하여 혐오 발언을 걸러낸다고 할 때 사람들은 AI가 찾는 패턴과 단어를 신속하게 파악하여 필터를 통과한다. 캐롤은 “세계적인 석학들이 이 문제를 해결하기 위해 노력하고 있지만 성공하지 못했다”라고 덧붙였다.

커니(Kearney)의 파트너 바라스 토타는 과거 300억 달러 규모의 글로벌 소비재 대기업에서 근무했던 당시의 사례를 예로 들면서, “CFO 리더십 팀은 성장 여부를 파악할 수 있도록 향상된 재무 지표 가시성을 원했다. 기존의 프로세스는 보고 기간이 종료되고 30일 후에 PDF 보고서를 받는 것이었다. 데이터 과학팀은 수치를 예측하기 위해 AI를 적용했다. 의도는 좋았다. 리더십에 미래 지향적인 시야를 제공하고자 했다”라고 말했다.

실수는 알고리즘에 입력한 재무 데이터에 있었다. 이 데이터를 제공한 재무 애널리스트는 많은 가정을 해야 했고, 따라서 데이터세트에는 개인적인 편향이 포함될 수밖에 없었다. 토타는 “과거를 살펴보는 게 아니라 미래를 예측할 수 있다는 점에서 리더십은 흥분했다. 하지만 분기가 끝나고 예측을 되돌아보니 전혀 딴판이었다”라고 전했다. 

이런 프로젝트가 실패하면 사람들은 AI에 대한 관심과 신뢰감을 잃는다고 그는 언급했다. 이 기업의 해결책은 CFO 리더십 팀이 필요할 때 필요한 지표를 제공하는 재무 대시보드를 구축해주는 단순한 일이었다. 결국 AI는 경영진에게 평이한 언어로 주요 데이터 인사이트를 자동 제공하는 자연어 생성 형태로 일부 사용됐다. 토타는 “가시성 문제였다. 그리고 그 가시성을 제공하는 간단한 솔루션이 있었다”라고 덧붙였다.

데이터 문제
대부분의 AI 프로젝트는 데이터가 필요하다. 좋은 데이터, 관련성 있는 데이터, 적절한 라벨이 붙어있고 결과를 왜곡할 수 있는 편향성이 없는 데이터가 필요하다. 예를 들면 고양이가 닭장에 들어오지 못하게 하는 방법을 찾고 있는 기업은 카메라 및 이미지 인식 기술을 설치하여 들어오는 고양이를 감지할 수 있다. 하지만 성공은 적절한 학습용 데이터세트를 확보하는 데 달려 있다.

가트너의 분석가 위트 앤드류스는 “많은 사진이 필요하며, 해당 사진에 고양이가 있는지 아닌지를 알려주는 라벨이 있어야 한다. 이러한 데이터를 수집하려면 시간과 비용이 많이 든다”라고 말했다. 아울러 이 모든 데이터를 수집한 기업은 같은 데이터 세트를 다른 프로젝트에도 재사용할 수 있을까?

하지만 해당 기업이 닭장에 몇 마리의 고양이가 들어오는지 파악해야 한다면 어떨까? 그러면 사진의 원본 데이터세트에 각 사진 속의 고양이 수로 라벨을 다시 붙여야 한다. 그는 “고양이 한 마리는 그렇게 비싸지 않을 수 있지만 고양이 떼는 문제가 된다”라고 언급했다. 또 이미지의 일부에만 여러 마리의 고양이가 있다면 정확한 모델을 얻는 게 훨씬 더 어려울 수 있다.

이런 상황은 마케팅 애플리케이션에서 자주 나타나는데, 기업들이 데이터세트가 매우 작아지는 수준까지 시장을 세분화하려고 하기 때문이다. PwC(PricewaterhouseCoopers)의 파트너 겸 글로벌 AI 리더 아난드 라오는 “알고 있는 거의 모든 기업이 고객 표적화를 위해 세분화를 한다”라고 지적했다. 기업들이 하나의 용도로 사용되리라 예상하면서 데이터를 수집한 후 다른 용도로 사용하게 되면 데이터세트가 새로운 요구 사항을 충족하지 못할 수 있다는 게 그의 설명이다.

예를 들면 미국 각 지역의 데이터 포인트가 균형을 이루도록 데이터 수집을 설정했지만 비즈니스 문제가 매우 협소한 인구 통계 부문의 요구에 해당되는 경우 모든 추론은 무용지물이 된다. 이를테면 기업이 특정 연령대의 아시아계 미국인 여성의 구매 습관에 관심이 있는데 표본에는 몇 명만 있다고 가정해보라. 그는 “세분화를 통해 어떤 결정을 내리고 싶은지 명확해야 한다. 표본 추출이 대표성을 확보하면서 문제도 포착하는지 확인해야 한다”라고 권고했다.

표본 문제는 드문 이벤트를 예측하려는 모든 시스템에서 발생한다. 예를 들어 기업이 수백만 건의 트랜잭션 데이터세트에서 사기 행위의 예를 찾고 있다면 여기에는 알려진 사기 행위의 수는 소수이고, 누락된 사기 행위가 더 많을 수 있다. 

라오는 “추론에 크게 유용하지 않다”라며, “기업에서 많은 사람이 매일 특정 업무를 수행하지만 이런 업무가 어떻게 수행되는지 데이터를 수집하지 않거나 AI를 학습시키는 데 필요한 데이터를 수집하지 않을 때 비즈니스 프로세스 자동화에서 이 문제가 많이 발생한다. 이런 경우에는 해당 정보를 수집하는 시스템을 구축해야 한다. 그리고 몇 개월 후에 다시 모델을 구축해야 한다”라고 덧붙였다.

아울러 데이터가 필요하지 않은 프로젝트 또한 AI가 적합하지 않다. 그는 “예를 들면 보험 및 보험 처리 등 일부 비즈니스 프로세스는 규칙을 기반으로 한다. 전문가를 인터뷰하고 전통적인 공식을 취합해 규칙 기반 시스템을 구축할 수 있다. 여기서 AI는 필요하지 않다. 과도한 할 것이다”라고 전했다. 

라오에 따르면 이런 프로젝트를 위해 AI를 사용하면 더 많은 시간이 필요할 수 있으며, 정확도는 비슷하거나 미미하게 나은 수준일 수 있다. 향상된 성능이 필요하지 않을 수도 있다. 그는 “이미 해결할 수 있었던 문제에 시간을 할애하고 있기 때문에 ROI를 달성하지 못할 것”이라고 말했다.

3억 달러 규모의 AI 실수
2021년 11월 온라인 부동산 회사 질로우(Zillow)는 AI 기반 서비스 ‘질로우 오퍼(Zillow Offers)’의 추천에 따라 구매한 주택으로 인해 3분기에만 3억 400만 달러의 재고상각을 초래했다. 이어 4분기 적자가 2억 4,000만 달러에서 2억 6,500만 달러에 달할 것으로 예측돼, 이에 따라 직원의 1/4을 해고해야 했다. 

질로우의 CEO 리치 바튼은 투자자와의 컨퍼런스 콜에서 “질로우 오퍼를 운영하는 짧은 기간 동안 글로벌 팬데믹, 주택 시장의 일시적인 동결, 공급-수요 불균형으로 인한 전례 없는 주택 가격 상승 등 일련의 이례적인 사건들을 경험했다. 이에 따라 미래의 주택 가격을 정확하게 예측할 수 없었다. 이 엄청난 변동성을 외인성 블랙스완 사건의 탓으로 돌리고, 학습한 것을 기반으로 모델을 수정하여 계속 운영할 수 있었다. 하지만 지금까지의 경험에 비춰보면 미래에도 예측할 수 없는 가격 전망 및 혼란이 발생하지 않으리라 가정하는 건 안일한 생각일 것이다”라고 밝혔다.

맥킨지의 수석 파트너 팀 파운틴은 “AI는 과거로부터 학습한다. 과거에 발생하지 않은 일을 알고리즘이 예측하는 건 불가능하다”라며, “AI는 상식이 없다. 이전에 화재가 발생한 적이 없는 공장의 생산량을 예측하도록 설계된 AI 알고리즘은 화재가 발생하면 생산량이 급감할 것이라고 예측하지 못할 것”이라고 말했다. ciokr@idg.co.kr
추천 테크라이브러리

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.