2021.03.31

미리 써보고 산다··· AI 기술 마켓플레이스 등장 ‘눈길’

Adrian Bridgwater | IDG Connect
‘인공지능(AI)’이 상품화되는 길목에 들어선 듯하다. 이를테면 석유, 금, 밀가루, 목화, 설탕 등의 상품과 똑같진 않더라도 AI를 거래할 수 있어서다. 그리고 이렇게 AI를 사고파는 새로운 마켓플레이스를 위한 전용 네트워크가 구축되고 있는 중이다. 

데이터의 경우 이미 거래가 이뤄지고 있다. 예를 들면 다웩스(Dawex)와 같은 데이터 거래 플랫폼 회사는 기업들이 서로의 익명화된 데이터세트를 사용할 수 있도록 해주는 플랫폼 및 도구를 전문적으로 제공하고 있다. 

일단 데이터세트 내 개인식별정보를 올바르게 마스킹하면 다른 기업에서 데이터 패턴을 관찰할 수 있고, 이를 자체 비즈니스 의사결정의 레퍼런스 템플릿으로 사용할 수 있다. 
 
ⓒGetty Images

‘살균(Sterilize)’하고 ‘위생 처리(Sanitize)’한 다음 공유하라
AI에서도 비슷한 일이 일어나고 있다. 한 기업이 비즈니스 문제를 해결하기 위해 AI 엔진 또는 더 작은 인공신경망 노드를 개발한다면, 다른 기업에서 동일한 도구를 사용할 수 있지 않을까? 이론상으로는 일단 ‘살균 및 위생 처리’를 거친다면 이러한 AI 도구를 다른 시스템에 접목할 수 있을 것이다. 

그렇다면 AI를 사고파는 상품으로 만들고자 구성요소를 분류하고 생산하기 시작하려면 무엇을 선행해야 할까? 비즈니스 용어로 말하자면 이는 문서 관리, 워크플로우 분석 및 프로세스 마이닝, 태스크 마이닝 등 매우 기본적인 관행으로 귀결되는 경우가 많다. 

광학문자인식(OCR) 기술 전문 회사 애비(Abbyy)는 이제 스스로를 디지털 인텔리전스 기업으로 지칭한다. 애비가 이렇게 거창한 이름을 붙인 이유는 지난 10년 동안 더 높은 수준의 소프트웨어 기능을 ‘자사 솔루션’에 적용하기 위해 기울인 온갖 노력 때문이다. 

애비는 최근 온라인에서 열린 사용자 컨퍼런스에서 자사의 ‘밴티지 2(Vantage 2)’ 소프트웨어를 상세히 설명했다. 회사에 따르면 밴티지 2는 문서 및 콘텐츠에서 필요한 정보를 읽어내야 하는 RPA 로봇, 자동화 시스템, 챗봇, 모바일 솔루션 등에 인지 기능을 제공한다. 

이 로우-코드/노-코드 AI 소프트웨어는 현업 부문 사용자가 IT에만 의존하지 않고 업무를 빠르게 디지털화할 수 있도록 고안됐다. 즉 이를 사용하면 대규모로 문서를 수집, 처리, 분석할 수 있다. 또한 이 과정에서 비즈니스 의사결정을 지원할 수 있는 결과(이를 업계에서는 흔히 ‘인사이트’라고 부른다)를 얻을 수 있다. 

지극히 평범한 비즈니스를 넘어
여러 측면에서 앞서 설명한 것들은 전혀 특별할 것 없는 비즈니스를 위한 AI 구성 요소다. 알기 쉽게 설명하자면 그저 ‘비즈니스에서 어떤 일이 일어나는지’, ‘어떤 프로세스가 진행되는지’, ‘그 결과로 문서에 어떤 데이터가 채워지는지’, ‘그 데이터는 무엇에 관한 것이며 무슨 의미가 있는지’, ‘그러면 이에 관해 무슨 일을 해야 하는지?’에 관한 문제인 것이다. 

하지만 AI가 제공하려는 건 당연히 평범한 비즈니스를 넘어서는 것이다. 

새로운 AI 소프트웨어와 함께, 애비는 ‘애비 마켓플레이스(Abbyy Marketplace)’를 선보였다. 이는 자동화 이니셔티브를 추진하는 기업이 재사용할 수 있는 AI 기술을 찾고 직접 써본 다음 구매할 수 있는 오픈 마켓플레이스다. 협력 업체는 콘텐츠 중심 프로세스를 자동화하는 모든 종류의 기술을 개발해 이 마켓플레이스에 올릴 수 있다고 회사 측은 설명했다. 

애비의 제품 마케팅 부문 SVP 브루스 오컷은 “이 마켓플레이스에서는 문서 분류와 데이터 추출을 위한 인지 기술, 즉시 사용할 수 있는 프로세스 플로우, 사전 구축된 커넥터 등을 포함해 재사용할 수 있는 기술 자산 모음을 온라인으로 제공한다”라고 말했다. 

이렇게 AI를 ‘써보고 구매(try-and-buy)’하는 방식에 관심 있는 기업이 많아진다면 애비는 비즈니스 인텔리전스(BI) 부문에서 상당한 수익 창출을 할 수 있을지도 모른다. 이 마켓플레이스에서 송장, 구매 주문서, 영수증, 대출 서류, 보험금 청구 등의 각종 문서를 처리할 수 있도록 사전에 훈련된 기술을 제공할 수 있기 때문이다. 

또한 앞서 언급한 것처럼 애비의 협력 업체들은 새로운 기술 및 기타 기술 자산을 마켓플레이스에 올리거나 또는 즉시 사용할 수 있는 자산을 활용(구매)해 자동화 프로젝트를 가속할 수 있다고 회사 측은 덧붙였다. 

오컷은 “오늘날 현업 부문 사용자들이 문서에 포함된 데이터를 더욱더 빠르게 파악하고 활용할 수 있는 방법을 모색하고 있다. 이들의 목표는 AI가 적용돼 있으며 쉽게 그리고 즉시 사용할 수 있는 기술을 통해 달성될 수 있다”라고 언급했다. 

AI 구매 시 주의해야 할 것
AI와 관련된 주요 과제 가운데 하나는 바로 ‘AI 편향(AI bias)’이다. 최근 IBM에서 실시한 연구에 따르면 사람의 의사결정에 영향을 미치는, 따라서 궁극적으로는 AI 엔진 개발에 영향을 줄 수 있는 ‘인간의 편견’이 무려 180가지에 이르는 것으로 나타났다. 

IBM은 이른바 ‘재현 데이터(synthetic data)’가 AI 편향 문제를 해결하는 방법이 될 수 있다고 강조했다. 재현 데이터는 실제 사건이나 현상에서 추출되거나 측정되는 게 아니라 부분 또는 전체가 인공적으로 생성되는 것을 말한다. 데이터세트가 충분히 다양하거나 크지 않으면 AI가 생성한 데이터로 부족한 부분을 메울 수 있으며 편향되지 않은 데이터세트를 형성할 수 있다. 

또한 데이터세트를 팀에서 수작업으로 구축하려면 몇 개월 또는 몇 년이 걸릴 수 있다. 하지만 재현 데이터로 설계하면 하룻밤 만에 완료할 수 있다. 

따라서 이는 AI 개발에 사용되는 데이터를 구축하기 위해 필요한 요소가 될 수 있다. 즉 AI 마켓플레이스에서 구매할 수 있는, AI 제품을 개발하기 위해 사용하는 AI인 것이다. 

그다음은 시민 AI(citizen AI)?
그렇다면 이제 ‘과연 이 모든 것이 우리를 어디로 이끄는가?’라는 의문이 든다. 일반적인 패턴을 따르자면 여러 기술이 합쳐져 프로그래머가 아닌 현업 사용자가 로우-코드/노-코드 소프트웨어 도구를 활용해 다양한 AI 기능을 생성하는 모습을 예상할 수 있을 것이다. 

이러한 ‘시민 AI 엔지니어(Citizen AI Engineers)’가 등장하기 시작했고, 이들은 구성 요소를 제대로 연결하기만 한다면 패키지화된 백엔드 AI 인텔리전스를 프론트라인 비즈니스 프로세스에 연결할 수 있게 될 것이다. 

물론 이러한 방식으로 개발된 AI는 위험할 수 있다. 이를테면 충분하게 세분화된 편향 제어, 소프트웨어 엔지니어링 우수성, 소프트웨어 통합, 확장성에 관한 사전 고려가 부족할 수 있기 때문이다. 

사실 AI는 이제서야 겨우 AI 마켓플레이스와 약간의 로우-코드/노-코드 도구에 대한 준비가 됐을 뿐이다. 따라서 가능하다면 일종의 ‘AI 자판기’는 당분간 피하는 게 좋다. 이를 피해야 한다는 걸 알 만큼 알지 않는가?
 
ciork@idg.co.kr



 



2021.03.31

미리 써보고 산다··· AI 기술 마켓플레이스 등장 ‘눈길’

Adrian Bridgwater | IDG Connect
‘인공지능(AI)’이 상품화되는 길목에 들어선 듯하다. 이를테면 석유, 금, 밀가루, 목화, 설탕 등의 상품과 똑같진 않더라도 AI를 거래할 수 있어서다. 그리고 이렇게 AI를 사고파는 새로운 마켓플레이스를 위한 전용 네트워크가 구축되고 있는 중이다. 

데이터의 경우 이미 거래가 이뤄지고 있다. 예를 들면 다웩스(Dawex)와 같은 데이터 거래 플랫폼 회사는 기업들이 서로의 익명화된 데이터세트를 사용할 수 있도록 해주는 플랫폼 및 도구를 전문적으로 제공하고 있다. 

일단 데이터세트 내 개인식별정보를 올바르게 마스킹하면 다른 기업에서 데이터 패턴을 관찰할 수 있고, 이를 자체 비즈니스 의사결정의 레퍼런스 템플릿으로 사용할 수 있다. 
 
ⓒGetty Images

‘살균(Sterilize)’하고 ‘위생 처리(Sanitize)’한 다음 공유하라
AI에서도 비슷한 일이 일어나고 있다. 한 기업이 비즈니스 문제를 해결하기 위해 AI 엔진 또는 더 작은 인공신경망 노드를 개발한다면, 다른 기업에서 동일한 도구를 사용할 수 있지 않을까? 이론상으로는 일단 ‘살균 및 위생 처리’를 거친다면 이러한 AI 도구를 다른 시스템에 접목할 수 있을 것이다. 

그렇다면 AI를 사고파는 상품으로 만들고자 구성요소를 분류하고 생산하기 시작하려면 무엇을 선행해야 할까? 비즈니스 용어로 말하자면 이는 문서 관리, 워크플로우 분석 및 프로세스 마이닝, 태스크 마이닝 등 매우 기본적인 관행으로 귀결되는 경우가 많다. 

광학문자인식(OCR) 기술 전문 회사 애비(Abbyy)는 이제 스스로를 디지털 인텔리전스 기업으로 지칭한다. 애비가 이렇게 거창한 이름을 붙인 이유는 지난 10년 동안 더 높은 수준의 소프트웨어 기능을 ‘자사 솔루션’에 적용하기 위해 기울인 온갖 노력 때문이다. 

애비는 최근 온라인에서 열린 사용자 컨퍼런스에서 자사의 ‘밴티지 2(Vantage 2)’ 소프트웨어를 상세히 설명했다. 회사에 따르면 밴티지 2는 문서 및 콘텐츠에서 필요한 정보를 읽어내야 하는 RPA 로봇, 자동화 시스템, 챗봇, 모바일 솔루션 등에 인지 기능을 제공한다. 

이 로우-코드/노-코드 AI 소프트웨어는 현업 부문 사용자가 IT에만 의존하지 않고 업무를 빠르게 디지털화할 수 있도록 고안됐다. 즉 이를 사용하면 대규모로 문서를 수집, 처리, 분석할 수 있다. 또한 이 과정에서 비즈니스 의사결정을 지원할 수 있는 결과(이를 업계에서는 흔히 ‘인사이트’라고 부른다)를 얻을 수 있다. 

지극히 평범한 비즈니스를 넘어
여러 측면에서 앞서 설명한 것들은 전혀 특별할 것 없는 비즈니스를 위한 AI 구성 요소다. 알기 쉽게 설명하자면 그저 ‘비즈니스에서 어떤 일이 일어나는지’, ‘어떤 프로세스가 진행되는지’, ‘그 결과로 문서에 어떤 데이터가 채워지는지’, ‘그 데이터는 무엇에 관한 것이며 무슨 의미가 있는지’, ‘그러면 이에 관해 무슨 일을 해야 하는지?’에 관한 문제인 것이다. 

하지만 AI가 제공하려는 건 당연히 평범한 비즈니스를 넘어서는 것이다. 

새로운 AI 소프트웨어와 함께, 애비는 ‘애비 마켓플레이스(Abbyy Marketplace)’를 선보였다. 이는 자동화 이니셔티브를 추진하는 기업이 재사용할 수 있는 AI 기술을 찾고 직접 써본 다음 구매할 수 있는 오픈 마켓플레이스다. 협력 업체는 콘텐츠 중심 프로세스를 자동화하는 모든 종류의 기술을 개발해 이 마켓플레이스에 올릴 수 있다고 회사 측은 설명했다. 

애비의 제품 마케팅 부문 SVP 브루스 오컷은 “이 마켓플레이스에서는 문서 분류와 데이터 추출을 위한 인지 기술, 즉시 사용할 수 있는 프로세스 플로우, 사전 구축된 커넥터 등을 포함해 재사용할 수 있는 기술 자산 모음을 온라인으로 제공한다”라고 말했다. 

이렇게 AI를 ‘써보고 구매(try-and-buy)’하는 방식에 관심 있는 기업이 많아진다면 애비는 비즈니스 인텔리전스(BI) 부문에서 상당한 수익 창출을 할 수 있을지도 모른다. 이 마켓플레이스에서 송장, 구매 주문서, 영수증, 대출 서류, 보험금 청구 등의 각종 문서를 처리할 수 있도록 사전에 훈련된 기술을 제공할 수 있기 때문이다. 

또한 앞서 언급한 것처럼 애비의 협력 업체들은 새로운 기술 및 기타 기술 자산을 마켓플레이스에 올리거나 또는 즉시 사용할 수 있는 자산을 활용(구매)해 자동화 프로젝트를 가속할 수 있다고 회사 측은 덧붙였다. 

오컷은 “오늘날 현업 부문 사용자들이 문서에 포함된 데이터를 더욱더 빠르게 파악하고 활용할 수 있는 방법을 모색하고 있다. 이들의 목표는 AI가 적용돼 있으며 쉽게 그리고 즉시 사용할 수 있는 기술을 통해 달성될 수 있다”라고 언급했다. 

AI 구매 시 주의해야 할 것
AI와 관련된 주요 과제 가운데 하나는 바로 ‘AI 편향(AI bias)’이다. 최근 IBM에서 실시한 연구에 따르면 사람의 의사결정에 영향을 미치는, 따라서 궁극적으로는 AI 엔진 개발에 영향을 줄 수 있는 ‘인간의 편견’이 무려 180가지에 이르는 것으로 나타났다. 

IBM은 이른바 ‘재현 데이터(synthetic data)’가 AI 편향 문제를 해결하는 방법이 될 수 있다고 강조했다. 재현 데이터는 실제 사건이나 현상에서 추출되거나 측정되는 게 아니라 부분 또는 전체가 인공적으로 생성되는 것을 말한다. 데이터세트가 충분히 다양하거나 크지 않으면 AI가 생성한 데이터로 부족한 부분을 메울 수 있으며 편향되지 않은 데이터세트를 형성할 수 있다. 

또한 데이터세트를 팀에서 수작업으로 구축하려면 몇 개월 또는 몇 년이 걸릴 수 있다. 하지만 재현 데이터로 설계하면 하룻밤 만에 완료할 수 있다. 

따라서 이는 AI 개발에 사용되는 데이터를 구축하기 위해 필요한 요소가 될 수 있다. 즉 AI 마켓플레이스에서 구매할 수 있는, AI 제품을 개발하기 위해 사용하는 AI인 것이다. 

그다음은 시민 AI(citizen AI)?
그렇다면 이제 ‘과연 이 모든 것이 우리를 어디로 이끄는가?’라는 의문이 든다. 일반적인 패턴을 따르자면 여러 기술이 합쳐져 프로그래머가 아닌 현업 사용자가 로우-코드/노-코드 소프트웨어 도구를 활용해 다양한 AI 기능을 생성하는 모습을 예상할 수 있을 것이다. 

이러한 ‘시민 AI 엔지니어(Citizen AI Engineers)’가 등장하기 시작했고, 이들은 구성 요소를 제대로 연결하기만 한다면 패키지화된 백엔드 AI 인텔리전스를 프론트라인 비즈니스 프로세스에 연결할 수 있게 될 것이다. 

물론 이러한 방식으로 개발된 AI는 위험할 수 있다. 이를테면 충분하게 세분화된 편향 제어, 소프트웨어 엔지니어링 우수성, 소프트웨어 통합, 확장성에 관한 사전 고려가 부족할 수 있기 때문이다. 

사실 AI는 이제서야 겨우 AI 마켓플레이스와 약간의 로우-코드/노-코드 도구에 대한 준비가 됐을 뿐이다. 따라서 가능하다면 일종의 ‘AI 자판기’는 당분간 피하는 게 좋다. 이를 피해야 한다는 걸 알 만큼 알지 않는가?
 
ciork@idg.co.kr



 

X