2019.10.11

기고 | AI 프로젝트, 인공지능에 관한 기대치를 낮춰서 시작하라

Zeus Kerravala | CIO
AI 시스템이 제품 생산 단계에 꼭 완벽하게 들어갈 필요는 없다. AI가 사람보다 더 잘하기만 하면 된다. 
 
ⓒGetty Images Bank

인공지능(AI)은 인류 역사상 가장 큰 변화의 원동력이 될 것이기 때문에 IT임원과 경영진 사이에서 화제가 되었다. AI가 모든 기기, 자동차, 가전제품 및 우리가 상호작용하는 모든 것에 들어간다면 우리가 일하고, 생활하며, 배우고, 노는 방식이 달라질 것이다. CIO는 이를 잘 알고 있으며 AI를 디지털 혁신 전략의 일부로 사용하려 하고 있다.

CIO가 AI를 활용하는 데에는 여러 문제가 있는 그중 하나는 사람들이 AI로 할 수 있는 일을 과대평가하고 AI가 완벽하리라 기대한다는 데에 있다. 실수가 있다 치더라도 알고리즘을 개선하거나 학습 단계에서 더 많은 시간을 소비하기 위해 처음으로 돌아간다. 예를 들어, 자율주행 자동차가 사고를 냈을 때 사람은 당황하겠지만 이 자율주행차의 작동은 마치 영화 터미네이터에 나오는 T-600과 비슷할 것이다. 자율주행 자동차라고 해서 사고가 나지 않을 수는 없다. 이 차가 우리 사회에 도움을 주려면 사람 운전자보다 조금만 더 우수하면 된다. 그러한 기준이라면 지금이라도 달성할 수 있다.

이는 광범위하게 AI 시스템이 생산에 투입되기 위해 보조적일 필요가 있음을 의미한다. AI가 의사를 더 똑똑하게 일하도록 할 수 있을까? AI가 사람보다 이미지를 더 빠르게 분류하는 데 도움이 될 수 있을까? AI가 엔지니어보다 정전을 더 빨리 예측할 수 있을까? 해당 임계값이 충족됐다면 일단 가동을 시작하고 AI가 주는 혜택을 누려라. 

‘가능한 최소한의 인텔리전스’를 목표로
지난주 필자는 캠브리지 컨설턴트, 엔비디아, 넷앱이 샌프란시스코에서 개최한 AI 행사에 참석했다. 캠브리지 컨설턴트의 AI 담당 이사인 팀 엔소는 자신의 기조연설에서 캠브리지 컨설턴트가 고객과 협력할 때 어떻게 AI 전략을 추진하며 어떻게 실행 가능한 최소한의 인텔리전스(Minimum Viable Intelligence)를 달성하는지 언급했다.

‘실행 가능한 최소한의 가능’ 의미에 대한 임계값은 사용 사례에 따라 다르다. 예를 들어, 유통/소매기업에서 고객 주문을 정리하는 AI 기반 로봇은 작은 오류라 해도 회사에 큰 부담을 줄 수 있기 때문에 거의 완벽해야 한다. 그러나 다른 애플리케이션의 경우 기대치가 거의 높지 않다.
 
캠브리지 컨설턴트가 발표한 사례 중 하나는 AI가 장르별로 노래를 분류하는 능력이었다. 엔소는 AI가 스튜디오 음악과 관련하여 상당히 훌륭하게 일을 했지만 재즈로 오류를 해석해 인간이 연주하는 데 어려움을 겪은 적이 있었다고 설명했다. 이 경우 잘못된 분류가 시스템에 피드백을 전달해 AI를 훈련할 수 있으므로 솔루션을 더 빨리 출시할수록 실제로 더 많은 데이터를 더 빨리 얻을 수 있다.

또 다른 예는 바실 AI(Bacill AI)로, 제 3세계 국가의 사람들에서 결핵을 찾기 위해 현미경 수준에서 의료 이미지를 볼 수 있는 의료 애플리케이션이다. 이 과정은 일반적으로 의사가 몇 시간이 걸리는 힘든 과정이지만 AI는 이미지를 스캔하고 짧은 시간에 테라바이트급 이상이 데이터를 찾을 수 있다. 다시 말하지만 알고리즘은 처음에 100% 완벽할 필요는 없으며, 더 많은 분석이 수행됨에 따라 시스템이 거의 완벽해지도록 훈련 데이터로 시스템에 데이터가 다시 전달될 수 있다.
 
데이터, 얼마나 많냐보다 얼마나 다양하냐가 관건
캠브리지 컨설턴트가 발표하는 동안 제기한 중요한 점은 다양한 유형의 데이터가 지니는 가치였다. 과거에는 기업에서 대량의 선별된 데이터(즉, 이상 항목, 중복 정보 등을 제거하기 위해 스크러빙 및 정리된 데이터)를 사용하여 AI 시스템을 교육했다. AI 학습 알고리즘이 그렇게 정교하지 않았기 때문에 이것이 필요했고, 많은 양의 데이터에도 불구하고 잘못된 통찰을 얻을 수 있었다. 오늘날 AI 시스템은 좀더 자연스럽게(즉, 인간과 같이) 학습하며, 큐레이팅하고, 정제되지 않은 원시 데이터나 사람이나 기계가 생성한 합성 데이터를 활용할 수 있기 때문에 훨씬 적은 양의 데이터로도 임무를 수행할 수 있다. 

또한 GAN(Generative Adversarial Network)을 사용하면 AI가 훈련 과정에서 자체적으로 데이터를 생성할 수 있다. 캠브리지 컨설턴트에 따르면, GAN에 익숙하지 않은 사람들에게는 정확한 데이터와 정확하지 않은 데이터를 혼합해 사용하며 학습 프로세스의 속도를 높이는 머신러닝 기반 시스템이다. 이는 MVI 구현이 훨씬 짧은 시간 안에 이뤄질 수 있음을 의미한다. 

*Zeus Kerravala는 ZK리서치(ZK Research)의 설립자 겸 수석 애널리스트다. ciokr@idg.co.kr



2019.10.11

기고 | AI 프로젝트, 인공지능에 관한 기대치를 낮춰서 시작하라

Zeus Kerravala | CIO
AI 시스템이 제품 생산 단계에 꼭 완벽하게 들어갈 필요는 없다. AI가 사람보다 더 잘하기만 하면 된다. 
 
ⓒGetty Images Bank

인공지능(AI)은 인류 역사상 가장 큰 변화의 원동력이 될 것이기 때문에 IT임원과 경영진 사이에서 화제가 되었다. AI가 모든 기기, 자동차, 가전제품 및 우리가 상호작용하는 모든 것에 들어간다면 우리가 일하고, 생활하며, 배우고, 노는 방식이 달라질 것이다. CIO는 이를 잘 알고 있으며 AI를 디지털 혁신 전략의 일부로 사용하려 하고 있다.

CIO가 AI를 활용하는 데에는 여러 문제가 있는 그중 하나는 사람들이 AI로 할 수 있는 일을 과대평가하고 AI가 완벽하리라 기대한다는 데에 있다. 실수가 있다 치더라도 알고리즘을 개선하거나 학습 단계에서 더 많은 시간을 소비하기 위해 처음으로 돌아간다. 예를 들어, 자율주행 자동차가 사고를 냈을 때 사람은 당황하겠지만 이 자율주행차의 작동은 마치 영화 터미네이터에 나오는 T-600과 비슷할 것이다. 자율주행 자동차라고 해서 사고가 나지 않을 수는 없다. 이 차가 우리 사회에 도움을 주려면 사람 운전자보다 조금만 더 우수하면 된다. 그러한 기준이라면 지금이라도 달성할 수 있다.

이는 광범위하게 AI 시스템이 생산에 투입되기 위해 보조적일 필요가 있음을 의미한다. AI가 의사를 더 똑똑하게 일하도록 할 수 있을까? AI가 사람보다 이미지를 더 빠르게 분류하는 데 도움이 될 수 있을까? AI가 엔지니어보다 정전을 더 빨리 예측할 수 있을까? 해당 임계값이 충족됐다면 일단 가동을 시작하고 AI가 주는 혜택을 누려라. 

‘가능한 최소한의 인텔리전스’를 목표로
지난주 필자는 캠브리지 컨설턴트, 엔비디아, 넷앱이 샌프란시스코에서 개최한 AI 행사에 참석했다. 캠브리지 컨설턴트의 AI 담당 이사인 팀 엔소는 자신의 기조연설에서 캠브리지 컨설턴트가 고객과 협력할 때 어떻게 AI 전략을 추진하며 어떻게 실행 가능한 최소한의 인텔리전스(Minimum Viable Intelligence)를 달성하는지 언급했다.

‘실행 가능한 최소한의 가능’ 의미에 대한 임계값은 사용 사례에 따라 다르다. 예를 들어, 유통/소매기업에서 고객 주문을 정리하는 AI 기반 로봇은 작은 오류라 해도 회사에 큰 부담을 줄 수 있기 때문에 거의 완벽해야 한다. 그러나 다른 애플리케이션의 경우 기대치가 거의 높지 않다.
 
캠브리지 컨설턴트가 발표한 사례 중 하나는 AI가 장르별로 노래를 분류하는 능력이었다. 엔소는 AI가 스튜디오 음악과 관련하여 상당히 훌륭하게 일을 했지만 재즈로 오류를 해석해 인간이 연주하는 데 어려움을 겪은 적이 있었다고 설명했다. 이 경우 잘못된 분류가 시스템에 피드백을 전달해 AI를 훈련할 수 있으므로 솔루션을 더 빨리 출시할수록 실제로 더 많은 데이터를 더 빨리 얻을 수 있다.

또 다른 예는 바실 AI(Bacill AI)로, 제 3세계 국가의 사람들에서 결핵을 찾기 위해 현미경 수준에서 의료 이미지를 볼 수 있는 의료 애플리케이션이다. 이 과정은 일반적으로 의사가 몇 시간이 걸리는 힘든 과정이지만 AI는 이미지를 스캔하고 짧은 시간에 테라바이트급 이상이 데이터를 찾을 수 있다. 다시 말하지만 알고리즘은 처음에 100% 완벽할 필요는 없으며, 더 많은 분석이 수행됨에 따라 시스템이 거의 완벽해지도록 훈련 데이터로 시스템에 데이터가 다시 전달될 수 있다.
 
데이터, 얼마나 많냐보다 얼마나 다양하냐가 관건
캠브리지 컨설턴트가 발표하는 동안 제기한 중요한 점은 다양한 유형의 데이터가 지니는 가치였다. 과거에는 기업에서 대량의 선별된 데이터(즉, 이상 항목, 중복 정보 등을 제거하기 위해 스크러빙 및 정리된 데이터)를 사용하여 AI 시스템을 교육했다. AI 학습 알고리즘이 그렇게 정교하지 않았기 때문에 이것이 필요했고, 많은 양의 데이터에도 불구하고 잘못된 통찰을 얻을 수 있었다. 오늘날 AI 시스템은 좀더 자연스럽게(즉, 인간과 같이) 학습하며, 큐레이팅하고, 정제되지 않은 원시 데이터나 사람이나 기계가 생성한 합성 데이터를 활용할 수 있기 때문에 훨씬 적은 양의 데이터로도 임무를 수행할 수 있다. 

또한 GAN(Generative Adversarial Network)을 사용하면 AI가 훈련 과정에서 자체적으로 데이터를 생성할 수 있다. 캠브리지 컨설턴트에 따르면, GAN에 익숙하지 않은 사람들에게는 정확한 데이터와 정확하지 않은 데이터를 혼합해 사용하며 학습 프로세스의 속도를 높이는 머신러닝 기반 시스템이다. 이는 MVI 구현이 훨씬 짧은 시간 안에 이뤄질 수 있음을 의미한다. 

*Zeus Kerravala는 ZK리서치(ZK Research)의 설립자 겸 수석 애널리스트다. ciokr@idg.co.kr

X