Offcanvas

AI / 디지털 트랜스포메이션 / 머신러닝|딥러닝 / 빅데이터 | 애널리틱스

‘노코드 AI’에서 미래를 보다··· 엑스페리언 데이터랩의 혁신 이야기

2022.02.25 Thor Olavsrud  |  CIO
글로벌 신용정보평가사 ‘엑스페리언(Experian)’은 데이터를 원동력으로 하는 회사라는 사실에 자부심을 갖고 있다. 그리고 이러한 데이터 중심 활동의 선봉에는 ‘엑스페리언 데이터랩(Experian DataLabs)’이 있다. 이 사업부는 데이터로 비즈니스를 혁신할 기회를 모색하고 있다. 

엑스페리언 데이터랩의 수석 부사장 겸 최고 데이터 과학자 케빈 첸은 “고객이 고수익을 얻을 기회를 포착하면 연구 자원을 투입하여 상품화 가능한 프로토타입을 개발한다”라고 말했다. 

그에 따르면 데이터랩 팀은 자유롭게 실험하고 아이디어를 솔루션화하면 이를 실행할 사업부에 넘긴 다음 다시 새로운 것에 관심을 쏟는다. 첸은 “항상 새로운 아이디어를 시도해볼 수 있다. 이는 인재를 끌어들이는 하나의 매력 포인트다”라고 언급했다. 
 
ⓒGetty Images

‘노코드 AI’의 이점
엑스페리언 데이터랩은 솔루션이 비즈니스를 변혁할 수 있는 문제를 파악하는 데 중점을 두고 있으며, 첸은 이를 ‘영향력이 큰 문제(high-impact problems)’라고 부른다. 

그는 소비자 신용부터 기업 신용, 온/오프라인 마케팅, 의료 정보 기술까지 여러 엑스페리언 사업부의 데이터를 연결했던 프로젝트를 예로 들었다. “과거 엑스페리언의 모든 데이터는 분산돼 있었고, 서로 연결돼 있지 않았다”라며, “그 모든 데이터를 함께 연계하는 건 간단한 일이 아니었다. 한 데이터가 데이터세트에 여러 방식으로 나타날 수 있기 때문이다. 데이터랩은 머신러닝을 활용하여 데이터세트를 학습하고 개별 데이터를 일치시켜 이 문제를 해결했다. 솔루션을 구축해보니 한 데이터세트에서 15~16개의 서로 다른 애플리케이션이 쏟아져 나왔다”라고 첸은 설명했다.

현재 ‘노코드 AI(No-code AI)’는 데이터랩의 주요 연구 분야다. 노코드 AI를 사용하면 드래그 앤드 드롭 인터페이스로 AI 및 머신러닝 모델을 구축할 수 있어 데이터 과학자 없이 일반 사용자도 AI를 활용할 수 있다. 하지만 첸은 노코드 AI가 “아직 현실적이지 않다”라며, “현시점에서는 노코드 AI가 있더라도 데이터 준비 및 처리에 전문 인력이 필요하다”라고 지적했다. 

이어서 그는 “노코드 AI의 목표는 일반 사용자도 데이터에 접근할 수 있도록 하는 것이지만 그렇다고 해서 데이터가 저절로 나타난다는 뜻은 아니다”라며, “지금 노코드 AI는 데이터를 추출하거나 쿼리하거나 모델링하지 못하더라도 이를 분석하고, 인사이트를 얻으며, 애널리틱스를 수행하는 방법을 민주화하는 것에 관해 이야기하고 있다”라고 덧붙였다. 

지난 몇 년 동안 엑스페리언은 2억 2,000만 명 소비자의 18년 치 신용 데이터와 상업 데이터, 자산 데이터, 대체 데이터 소스를 기반으로 하는 고급 분석 샌드박스 ‘어센드 애널리티컬 샌드박스(Ascend Analytical Sandbox)’를 구축해 왔다. 첸은 “어센드 애널리티컬 샌드박스는 완전히 익명화된 소비자 신용 행동 데이터의 보고”라면서, “엑스페리언 내·외부의 데이터 과학자가 데이터를 탐색할 수 있게 구축됐다”라고 설명했다.

여기서 노코드 AI는 이 개념을 확장하여, 비즈니스 의사결정권자(예: 위험 관리자 등)가 해당 샌드박스 및 데이터에 직접 접근할 수 있도록 할 수 있다. 그는 “이를테면 비즈니스 의사결정권자가 데이터를 검토하여 고객의 동향을 파악하거나 동종 업체와 비교할 수 있다. 더 나아가, 비즈니스 의사결정권자가 평소 사용하는 말로 데이터에 직접 액세스하고, 쿼리하며, 질문할 수 있도록 지원할 예정이다”라고 전했다. 

첸에 따르면 ‘어센드 인터랙트(Ascend Interact)’라고 명명된 이 프로젝트는 딥러닝, 자연어 이해(NLU), 자연어 처리(NLP)를 사용하여 비즈니스 의사결정권자가 데이터 과학팀을 통하지 않고도 엑스페리언의 방대한 데이터와 직접 상호작용하고, 가능하다면 각 사업부의 데이터와 결합할 수 있게끔 하는 방안을 추진 중이다.

그는 “단순히 고객사의 데이터 과학팀에 데이터를 넘기는 게 아니라 다양한 사용자와 공유할 수 있다. 이러한 사용자는 공유된 데이터를 활용해 즉시 의사결정을 내릴 수 있다. 필요하다면 데이터 과학자의 지원도 여전히 제공된다. 하지만 이러한 변화로 주도권을 쥐게 된 의사결정권자는 항상 데이터 과학자에게 의존할 필요가 없다”라고 말했다.   

의도 파악하기
이 프로젝트는 아직 R&D 단계에 있다. 첸은 엑스페리언이 2가지 관점에서 (이 프로젝트를) 접근하고 있다고 밝혔다. 하나는 소프트웨어 엔지니어링을 데이터 과학에 접목하는 ML옵스(MLOps)다. 이는 머신러닝 모델을 프로덕션 환경으로 가져온 다음 모니터링 및 유지관리하는 프로세스를 간소화한다. “이 관점에서 문제에 접근하면 사용자를 위해 머신러닝 프로세스를 자동화하는 오토ML(AutoML) 개념 중심의 솔루션이 보인다”라고 그는 전했다.

다른 하나는 대시보드 중심의 비즈니스 인텔리전스(BI)다. 구체적으로는 노코드 AI를 활용해 사용자의 니즈에 맞춰 동적 대시보드를 제공하는 것이다. 현재로서는 사용자가 원하는 것이 무엇인지 정확하게 파악하는 게 주요 과제라고 첸은 언급했다. 이어서 “사용자가 원하는 것을 파악하기 위해 딥러닝 기반 솔루션을 대거 도입했다”라며, “사용자의 의도를 데이터 내용과 연관시킬 수 있어야 한다. 그다음 사용자가 원하는 바를 실제로 실행할 수 있도록 코드를 구성할 수 있어야 한다”라고 덧붙였다.

첸에 따르면 여기서 가장 큰 과제는 도메인 지식이다. 그는 “사용자가 데이터베이스의 데이터에 이미 일정 수준의 도메인 지식을 갖고 있을 때가 많다”라며, “노코드 AI 솔루션은 사용자가 ‘전문가 대 전문가’로 이야기한다는 느낌을 받을 수 있도록 해당 데이터에 유사한 수준의 도메인 전문지식을 보여줘야 한다”라고 말했다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.