2020.05.18

텍스트 데이터에서 가치를 도출하라··· NLP 성공 사례 5선

Thor Olavsrud | CIO
자연어 처리(NLP) 기술을 이용해 향상된 고객 서비스를 제공하고 반복 작업을 자동화하며 운영을 간소화하는 5개 기업의 사례를 살펴본다.

오늘날 데이터는 기업의 가장 중요한 재화다. IDG의 2020 CIO 현황 보고서(State of the CIO 2020)에 따르면 IT 리더의 37%가 올해 IT 투자를 견인할 요소로 데이터 애널리틱스를 꼽았다. 

여러 형태의 데이터 가운데 가장 활용되지 않은 데이터 풀은 아마 텍스트로 구성돼 있을 가능성이 높다. 소셜 미디어 피드는 말할 것도 없고 예를 들면 특허, 제품 사양, 학술 간행물, 시장 조사, 뉴스 등은 모두 텍스트가 기본 구성 요소다. 텍스트의 양은 계속해서 늘고 있다. 

시장조사업체 럭스 리서치(Lux Research)는 NLP 기술, 특히 토픽 모델링(topic modeling)이 데이터의 숨겨진 가치를 찾아낼 수 있는 핵심 도구가 되고 있다고 말했다. 
 
ⓒGetty Images

자연어 처리(NLP)는 인공지능(AI)의 한 갈래다. 컴퓨터가 사람처럼 언어를 이해하고 처리하며 구사할 수 있도록 해준다. 이를테면 검색 엔진, 기계 번역 서비스, 음성 비서가 모두 NLP로 구동된다. 

그중 토픽 모델링은 연관된 단어들로 묶인 토픽을 찾아내는 NLP 기법이다. 럭스 리서치에 따르면 기업은 토픽 모델링을 통해 문서를 특정 주제와 연관시킨 후 시간에 따라 해당 토픽이 얼마나 증가하는지 동향 분석 데이터를 추출할 수 있다. 이밖에 문서에 '지문(fingerprint)'를 설정하고, 비슷한 지문이 있는 다른 문서를 검색하는 데에도 토픽 모델링을 활용할 수 있다. 

AI의 비즈니스 가치에 대한 관심이 늘어나면서 많은 기업이 NLP 기술로 눈을 돌리고 있다. 비정형 데이터인 텍스트 문서에서 가치를 끌어내기 위해서다. 시장조사업체 모도 인텔리전스(Mordor Intelligence)는 2019년 69억 4,000만 달러였던 NLP 시장 규모가 2025년까지 3배 이상 증가할 것으로 전망했다. 여러 기업이 NLP를 어떻게 활용하고 있는지 5가지 성공 사례를 소개한다. 

1. 액센츄어(Accenture): 계약서 검토 및 분석
글로벌 컨설팅 기업 액센츄어는 NLP를 계약서 분석에 활용 중이다. 해당 기업은 이를 두고 앨리스 프로젝트(ALICE, Accenture's Legal Intelligent Contract Exploration)라고 부르고 있다. 2,800명의 전문가로 구성된 법무팀이 100만 건이 넘는 계약서에서 계약 조항을 비롯한 텍스트 검색을 하는 데 이 프로젝트를 이용하고 있다. 

앨리스는 의미적 유사성을 바탕으로 단어를 비교하는 자연어 처리 방식인 '단어 임베딩(Word Embedding)'을 이용한다. 이를 통해 계약 문서를 한 단락씩 검토하고, 핵심어를 찾아 해당 단락이 특정 계약 조항 종류와 연관되는지 파악한다. 예를 들면 ‘홍수’, ‘지진’, ‘재난’ 등과 같은 단어는 ‘불가항력’ 조항과 함께 흔히 쓰인다.

액센츄어의 디지털 비즈니스 트랜스포메이션 및 기업 애널리틱스 부문 글로벌 전무 이사 마이크 마레스카는 “부가가치를 창출할 기회를 발굴하고자 확장하고 개선해 나가면서 유즈 케이스가 늘어났다”라며, “우리는 보유한 데이터에서 가치를 얻을 수 있는 새로운 방법을 찾고 있다”라고 말했다.

액센츄어는 앨리스 프로젝트 덕분에 변호사들이 특정 정보를 찾느라 문서를 직접 읽는 데 걸리는 시간을 크게 줄였다고 밝혔다. 

자연어 처리 기술 도입을 겁내서는 안 된다고 마레카스는 조언했다. 이어서 그는 “혁신이 기업 문화의 일부라면 실패를 두려워하지 않아도 된다. 실험하고 반복하라”라고 덧붙였다.

2. 버라이즌(Verizon): 고객 서비스 자동화 
버라이즌의 기업 대상 서비스 지원팀은 NLP 및 딥러닝을 이용해 고객 요청 처리 과정을 자동화하고 있다. 기존에는 매월 10만 건 이상 들어오는 고객 요청 사항을 읽고 일일이 조치해야 했다. 버라이즌의 글로벌 기술 서비스 팀(GTS)이 서비스 지원을 위한 ‘AI 기반 디지털 워커(AI-Enabled Digital Worker)’를 구축한 이후에는 그럴 필요가 없어졌다. 

네트워크 기반 딥러닝과 NLP를 통합한 디지털 워커는 주로 이메일과 버라이즌 웹 포털을 통해 전달되는 서비스 요청 티켓을 확인한다. 또한 현 티켓 전달 상태나 진행 현황 업데이트와 같은 일반적인 요청에도 자동 응답해준다. 여기서 처리할 수 없는 복잡한 문제들은 사람 직원에게 전달된다. 

버라이즌의 글로벌 기술 서비스 팀(GTS) 시스템 엔지니어링 책임자 스테판 토스는 "고객 요청에 대한 응답을 자동화해 사용자가 이메일을 발송한 지 몇 시간이 아닌 몇 분 내에 응답을 할 수 있다"라고 설명했다. 

지난 2월 버라이즌은 디지털 워커가 2019년 2분기 이후 연간 1만 시간에 가까운 업무 시간을 절약했다고 밝혔다.  

오픈소스를 찾아보라는 것이 토스의 조언이다. 그는 “주위를 둘러보고 협력업체와 연계하다 보면 기회가 생길 것”이라며, “플랫폼에 고액을 투자하기에 앞서 오픈소스를 살펴보고 실험하라. 우리는 오픈소스에서 이용할 수 있는 것이 많다는 사실을 알게 됐다”라고 말했다.

3. PSE&G: 음성으로 고객 지원하는 가상 비서 도입 
미국의 전력 및 가스 회사 PSE&G는 가상 비서 기술을 비롯한 각종 디지털 서비스를 도입했다. 고객들이 음성 명령을 통해서 사용량을 확인하거나 요금을 납부할 수 있도록 하기 위해서였다. 

PSE&G 가상 비서는 아마존 알렉사(Amazon Alexa)를 활용해 자연어 처리 방식의 음성 인터페이스를 제공한다. 이 음성 인터페이스는 아마존의 알렉사 스킬 키트(Alexa Skills Kit)를 사용해 구축됐다. 해당 프로젝트의 수석 개발자 살바토레 오르시노는 “우리가 단순히 서비스만 제공하는 데 그치지 않고 고객을 위해 존재한다는 것을 보여주고자 노력하고 있다”라고 언급했다.

PSE&G 고객은 에코(Echo), 에코 닷(Echo Dot), 킨들 파이어(Kindle Fire) 등 알렉사 지원 장치를 통해 이 가상 비서에 접근할 수 있다. PSE&G에 따르면 2019년 7월 기준으로 고객들은 가상 비서를 통해 1만 건 이상의 요청을 했다. 납부 기일 확인부터 사용량 확인, 에너지 절약 요령, 요금 납부에 이르기까지 요청 사항은 다양했다.

오르시노는 변화 관리가 필수적이라고 조언했다. 그가 이 프로젝트를 시작했을 당시 PSE&G는 신규 소프트웨어 개발에 조예가 깊지 않았고, 직원들도 처음에는 해당 제품이 가치를 제공할 것이라고 확신하지 못했다. 

오르시노는 “알렉사가 고객과의 훌륭한 의사소통 채널이라는 것과 그로 인한 가치를 알게 되자 다들 마음을 열었고 이제는 알렉사는 물론 다른 신규 애플리케이션을 활용할 수 있도록 변화하는 데 적극적이다”라고 설명했다.

4. GWL(Great Wolf Lodge): 고객 감정 분석
미국의 리조트 체인인 그레이트 울프 롯지의 GAIL(Great Wolf's Artificial Intelligence Lexicographer)은 매달 설문조사로 받는 리뷰를 검토해 작성자가 순 추천자인지, 폄하하는 사람인지 아니면 중립자인지 판단한다. 

자연어 처리를 활용하는 이 AI 모델은 클라우드에서 실행되며 내부적으로 개발한 알고리즘을 사용한다. 또한 6만 7,000개 이상의 리뷰를 학습했다. 이를 통해 설문조사 응답자가 GWL에 대해 그렇게 느낀 이유를 알 수 있는 핵심 요소를 찾아낸다. GWL에 따르면 2019년 9월 기준 GAIL은 95%의 정확도를 보였다. GAIL이 아직 이해할 수 없는 리뷰에 대해서는 전통적인 텍스트 분석을 활용한다. 

GWL의 CIO 에드워드 말리노스키는 “모든 곳에서 투숙객과 더 잘 소통하고 싶다”고 말했다. 이제 GWL 비즈니스 운영팀은 GAIL로 생성된 인사이트를 기반으로 서비스를 개선하고 있다. 투숙객들이 자주 묻는 질문을 답변해 주는 챗봇도 검토 중이다. 

기술을 위한 기술은 피하라고 그는 조언했다. 말리노스키는 기술과 실용성의 균형이 적절하면서도 비즈니스 목표와 정렬되는 툴을 선택해야 한다고 말하면서, “허울만 좋은 것이 어떤 것인지 그리고 문제에 적합한 해결책이 무엇인지 신중하게 고려해야 한다”라고 당부했다.

5. 애트나(Aetna): 신속한 보험금 청구
미국 의료보험사 애트나는 '복합 공급자 계약 자동 판정(Auto-adjudication of Complex Provider Contracts)' 앱을 통해 각 보험의 지급액, 본인 부담금, 수수료 확인 과정을 자동화했다. 

자연어 처리와 특수 데이터베이스 소프트웨어를 결합해 구축된 이 앱은 납입 상태를 확인한 후 시스템으로 자동 판독할 수 있는 데이터를 추가한다. 그 결과 여러 건의 청구를 하룻밤 만에 처리할 수 있다. 애트나에 따르면 해당 앱 덕분에 더 많은 조율이 필요한 계약과 청구 건에 50명의 청구 담당 직원들을 집중 투입할 수 있었다. 

애트나의 CTO 클라우스 옌센은 “결국 중요한 것은 최종 사용자에게 더 나은 경험을 제공하는 것”이라며, “이 소프트웨어는 애트나가 의료 생태계에서 의료기관 및 환자들에게 더 나은 협력자가 되도록 도울 것이다”라고 전했다. 이어서 그는 “단순히 보험금을 지급하고 전화로 질문에 대답하는 것 이상의 일을 해야 한다”라고 덧붙였다. 

2019년 7월 기준 애트나는 이 앱을 통해 청구 건 처리 및 재작업에 있어서 연간 600만 달러의 비용 절감이 있을 것으로 예상했다. 

옌센은 중요한 것에 집중하고 서두르지 말 것을 조언했다. 그는 지나치게 광범위한 해결책은 모호하기 때문에 결국 실패할 것이라며, 만일 애트나가 일반적인 AI를 비즈니스에 적용하려 했다면 효과가 없었을 것이라고 덧붙였다. 또한 애트나는 프로세스 적용과 규칙 제정, 앱 테스트에 몇 달을 투자했다. 옌센은 많은 사람들이 서두르지 않고 제대로 일을 할 수 있을 만한 인내심이 없다고 지적했다. ciokr@idg.co.kr



2020.05.18

텍스트 데이터에서 가치를 도출하라··· NLP 성공 사례 5선

Thor Olavsrud | CIO
자연어 처리(NLP) 기술을 이용해 향상된 고객 서비스를 제공하고 반복 작업을 자동화하며 운영을 간소화하는 5개 기업의 사례를 살펴본다.

오늘날 데이터는 기업의 가장 중요한 재화다. IDG의 2020 CIO 현황 보고서(State of the CIO 2020)에 따르면 IT 리더의 37%가 올해 IT 투자를 견인할 요소로 데이터 애널리틱스를 꼽았다. 

여러 형태의 데이터 가운데 가장 활용되지 않은 데이터 풀은 아마 텍스트로 구성돼 있을 가능성이 높다. 소셜 미디어 피드는 말할 것도 없고 예를 들면 특허, 제품 사양, 학술 간행물, 시장 조사, 뉴스 등은 모두 텍스트가 기본 구성 요소다. 텍스트의 양은 계속해서 늘고 있다. 

시장조사업체 럭스 리서치(Lux Research)는 NLP 기술, 특히 토픽 모델링(topic modeling)이 데이터의 숨겨진 가치를 찾아낼 수 있는 핵심 도구가 되고 있다고 말했다. 
 
ⓒGetty Images

자연어 처리(NLP)는 인공지능(AI)의 한 갈래다. 컴퓨터가 사람처럼 언어를 이해하고 처리하며 구사할 수 있도록 해준다. 이를테면 검색 엔진, 기계 번역 서비스, 음성 비서가 모두 NLP로 구동된다. 

그중 토픽 모델링은 연관된 단어들로 묶인 토픽을 찾아내는 NLP 기법이다. 럭스 리서치에 따르면 기업은 토픽 모델링을 통해 문서를 특정 주제와 연관시킨 후 시간에 따라 해당 토픽이 얼마나 증가하는지 동향 분석 데이터를 추출할 수 있다. 이밖에 문서에 '지문(fingerprint)'를 설정하고, 비슷한 지문이 있는 다른 문서를 검색하는 데에도 토픽 모델링을 활용할 수 있다. 

AI의 비즈니스 가치에 대한 관심이 늘어나면서 많은 기업이 NLP 기술로 눈을 돌리고 있다. 비정형 데이터인 텍스트 문서에서 가치를 끌어내기 위해서다. 시장조사업체 모도 인텔리전스(Mordor Intelligence)는 2019년 69억 4,000만 달러였던 NLP 시장 규모가 2025년까지 3배 이상 증가할 것으로 전망했다. 여러 기업이 NLP를 어떻게 활용하고 있는지 5가지 성공 사례를 소개한다. 

1. 액센츄어(Accenture): 계약서 검토 및 분석
글로벌 컨설팅 기업 액센츄어는 NLP를 계약서 분석에 활용 중이다. 해당 기업은 이를 두고 앨리스 프로젝트(ALICE, Accenture's Legal Intelligent Contract Exploration)라고 부르고 있다. 2,800명의 전문가로 구성된 법무팀이 100만 건이 넘는 계약서에서 계약 조항을 비롯한 텍스트 검색을 하는 데 이 프로젝트를 이용하고 있다. 

앨리스는 의미적 유사성을 바탕으로 단어를 비교하는 자연어 처리 방식인 '단어 임베딩(Word Embedding)'을 이용한다. 이를 통해 계약 문서를 한 단락씩 검토하고, 핵심어를 찾아 해당 단락이 특정 계약 조항 종류와 연관되는지 파악한다. 예를 들면 ‘홍수’, ‘지진’, ‘재난’ 등과 같은 단어는 ‘불가항력’ 조항과 함께 흔히 쓰인다.

액센츄어의 디지털 비즈니스 트랜스포메이션 및 기업 애널리틱스 부문 글로벌 전무 이사 마이크 마레스카는 “부가가치를 창출할 기회를 발굴하고자 확장하고 개선해 나가면서 유즈 케이스가 늘어났다”라며, “우리는 보유한 데이터에서 가치를 얻을 수 있는 새로운 방법을 찾고 있다”라고 말했다.

액센츄어는 앨리스 프로젝트 덕분에 변호사들이 특정 정보를 찾느라 문서를 직접 읽는 데 걸리는 시간을 크게 줄였다고 밝혔다. 

자연어 처리 기술 도입을 겁내서는 안 된다고 마레카스는 조언했다. 이어서 그는 “혁신이 기업 문화의 일부라면 실패를 두려워하지 않아도 된다. 실험하고 반복하라”라고 덧붙였다.

2. 버라이즌(Verizon): 고객 서비스 자동화 
버라이즌의 기업 대상 서비스 지원팀은 NLP 및 딥러닝을 이용해 고객 요청 처리 과정을 자동화하고 있다. 기존에는 매월 10만 건 이상 들어오는 고객 요청 사항을 읽고 일일이 조치해야 했다. 버라이즌의 글로벌 기술 서비스 팀(GTS)이 서비스 지원을 위한 ‘AI 기반 디지털 워커(AI-Enabled Digital Worker)’를 구축한 이후에는 그럴 필요가 없어졌다. 

네트워크 기반 딥러닝과 NLP를 통합한 디지털 워커는 주로 이메일과 버라이즌 웹 포털을 통해 전달되는 서비스 요청 티켓을 확인한다. 또한 현 티켓 전달 상태나 진행 현황 업데이트와 같은 일반적인 요청에도 자동 응답해준다. 여기서 처리할 수 없는 복잡한 문제들은 사람 직원에게 전달된다. 

버라이즌의 글로벌 기술 서비스 팀(GTS) 시스템 엔지니어링 책임자 스테판 토스는 "고객 요청에 대한 응답을 자동화해 사용자가 이메일을 발송한 지 몇 시간이 아닌 몇 분 내에 응답을 할 수 있다"라고 설명했다. 

지난 2월 버라이즌은 디지털 워커가 2019년 2분기 이후 연간 1만 시간에 가까운 업무 시간을 절약했다고 밝혔다.  

오픈소스를 찾아보라는 것이 토스의 조언이다. 그는 “주위를 둘러보고 협력업체와 연계하다 보면 기회가 생길 것”이라며, “플랫폼에 고액을 투자하기에 앞서 오픈소스를 살펴보고 실험하라. 우리는 오픈소스에서 이용할 수 있는 것이 많다는 사실을 알게 됐다”라고 말했다.

3. PSE&G: 음성으로 고객 지원하는 가상 비서 도입 
미국의 전력 및 가스 회사 PSE&G는 가상 비서 기술을 비롯한 각종 디지털 서비스를 도입했다. 고객들이 음성 명령을 통해서 사용량을 확인하거나 요금을 납부할 수 있도록 하기 위해서였다. 

PSE&G 가상 비서는 아마존 알렉사(Amazon Alexa)를 활용해 자연어 처리 방식의 음성 인터페이스를 제공한다. 이 음성 인터페이스는 아마존의 알렉사 스킬 키트(Alexa Skills Kit)를 사용해 구축됐다. 해당 프로젝트의 수석 개발자 살바토레 오르시노는 “우리가 단순히 서비스만 제공하는 데 그치지 않고 고객을 위해 존재한다는 것을 보여주고자 노력하고 있다”라고 언급했다.

PSE&G 고객은 에코(Echo), 에코 닷(Echo Dot), 킨들 파이어(Kindle Fire) 등 알렉사 지원 장치를 통해 이 가상 비서에 접근할 수 있다. PSE&G에 따르면 2019년 7월 기준으로 고객들은 가상 비서를 통해 1만 건 이상의 요청을 했다. 납부 기일 확인부터 사용량 확인, 에너지 절약 요령, 요금 납부에 이르기까지 요청 사항은 다양했다.

오르시노는 변화 관리가 필수적이라고 조언했다. 그가 이 프로젝트를 시작했을 당시 PSE&G는 신규 소프트웨어 개발에 조예가 깊지 않았고, 직원들도 처음에는 해당 제품이 가치를 제공할 것이라고 확신하지 못했다. 

오르시노는 “알렉사가 고객과의 훌륭한 의사소통 채널이라는 것과 그로 인한 가치를 알게 되자 다들 마음을 열었고 이제는 알렉사는 물론 다른 신규 애플리케이션을 활용할 수 있도록 변화하는 데 적극적이다”라고 설명했다.

4. GWL(Great Wolf Lodge): 고객 감정 분석
미국의 리조트 체인인 그레이트 울프 롯지의 GAIL(Great Wolf's Artificial Intelligence Lexicographer)은 매달 설문조사로 받는 리뷰를 검토해 작성자가 순 추천자인지, 폄하하는 사람인지 아니면 중립자인지 판단한다. 

자연어 처리를 활용하는 이 AI 모델은 클라우드에서 실행되며 내부적으로 개발한 알고리즘을 사용한다. 또한 6만 7,000개 이상의 리뷰를 학습했다. 이를 통해 설문조사 응답자가 GWL에 대해 그렇게 느낀 이유를 알 수 있는 핵심 요소를 찾아낸다. GWL에 따르면 2019년 9월 기준 GAIL은 95%의 정확도를 보였다. GAIL이 아직 이해할 수 없는 리뷰에 대해서는 전통적인 텍스트 분석을 활용한다. 

GWL의 CIO 에드워드 말리노스키는 “모든 곳에서 투숙객과 더 잘 소통하고 싶다”고 말했다. 이제 GWL 비즈니스 운영팀은 GAIL로 생성된 인사이트를 기반으로 서비스를 개선하고 있다. 투숙객들이 자주 묻는 질문을 답변해 주는 챗봇도 검토 중이다. 

기술을 위한 기술은 피하라고 그는 조언했다. 말리노스키는 기술과 실용성의 균형이 적절하면서도 비즈니스 목표와 정렬되는 툴을 선택해야 한다고 말하면서, “허울만 좋은 것이 어떤 것인지 그리고 문제에 적합한 해결책이 무엇인지 신중하게 고려해야 한다”라고 당부했다.

5. 애트나(Aetna): 신속한 보험금 청구
미국 의료보험사 애트나는 '복합 공급자 계약 자동 판정(Auto-adjudication of Complex Provider Contracts)' 앱을 통해 각 보험의 지급액, 본인 부담금, 수수료 확인 과정을 자동화했다. 

자연어 처리와 특수 데이터베이스 소프트웨어를 결합해 구축된 이 앱은 납입 상태를 확인한 후 시스템으로 자동 판독할 수 있는 데이터를 추가한다. 그 결과 여러 건의 청구를 하룻밤 만에 처리할 수 있다. 애트나에 따르면 해당 앱 덕분에 더 많은 조율이 필요한 계약과 청구 건에 50명의 청구 담당 직원들을 집중 투입할 수 있었다. 

애트나의 CTO 클라우스 옌센은 “결국 중요한 것은 최종 사용자에게 더 나은 경험을 제공하는 것”이라며, “이 소프트웨어는 애트나가 의료 생태계에서 의료기관 및 환자들에게 더 나은 협력자가 되도록 도울 것이다”라고 전했다. 이어서 그는 “단순히 보험금을 지급하고 전화로 질문에 대답하는 것 이상의 일을 해야 한다”라고 덧붙였다. 

2019년 7월 기준 애트나는 이 앱을 통해 청구 건 처리 및 재작업에 있어서 연간 600만 달러의 비용 절감이 있을 것으로 예상했다. 

옌센은 중요한 것에 집중하고 서두르지 말 것을 조언했다. 그는 지나치게 광범위한 해결책은 모호하기 때문에 결국 실패할 것이라며, 만일 애트나가 일반적인 AI를 비즈니스에 적용하려 했다면 효과가 없었을 것이라고 덧붙였다. 또한 애트나는 프로세스 적용과 규칙 제정, 앱 테스트에 몇 달을 투자했다. 옌센은 많은 사람들이 서두르지 않고 제대로 일을 할 수 있을 만한 인내심이 없다고 지적했다. ciokr@idg.co.kr

X