Offcanvas

AI / 머신러닝|딥러닝

기고 | AI, 머신러닝에 대한 마이크로소프트의 분류법과 구상안

2017.03.31 스티븐 맥스 패터슨  |  Network World
초기 상용 인공지능(AI), 머신러닝(ML) 시장을 선점하기 위한 마이크로소프트, 구글, IBM의 각축이 치열한 상황이다. 지난주 MIT 테크놀로지 리뷰 엠테크 디지털(MIT Technology Review EmTech Digital) 컨퍼런스 행사장에서 필자는 마이크로소프트 AI 리서치 부문의 피터 리(Peter Lee) 부사장을 만나 AI, ML과 관련한 과제 극복을 위한 마이크로소프트의 방향성 구상에 관한 아이디어를 전해들을 수 있었다.

리는 본인이 마이크로소프트의 CEO사티야 나델라와 나눈 대화를 소개하며 이야기를 시작했다. 그는 “리서치 엔지니어 출신인 나델라에게 기술적 측면에 관한 설명은 별로 필요하지 않았다. 다만 우리가 타깃으로 하는 수직 산업들의 미래를 관리할 프레임워크가 우리 AI 그룹의 관리 구조에까지 영향을 미친다는 측면에 관해서는 이해가 필요했다. 이것은 우리 마이크로소프트 전체 인력의 1/4 가량인 6,000여 명의 직원들에게 영향을 미칠, 나아가 우리뿐 아니라 의료, 교육, 차량, 금융, 소매 등 주요 산업의 비즈니스들 모두와 관련된 문제다. 우리는 AI의 미래와 관련해 막대한 베팅을 한 상태다”라고 이야기했다.

마이크로소프트는 어떻게 AI의 기회를 분류하고 있는가?
필자의 이해를 돕기 위해 리는 우선 자신이 나델라에게 설명했던, 현 세대 머신러닝(ML)의 3가지 층위 분류를 소개했다:

티어 0: 고객들은 마이크로소프트의 사전 학습(Pretrained) 모델에 영역 특화적 카테고리 정도만을 추가해 바로 이용이 가능하다. 이를테면 마이크로소프트의 기계번역 API를 활용해 댓글을 번역하거나, 이 번역 API 서비스에 ‘여성 패션 관련 어휘’ 등 특정 영역 특화적 범주를 추가 적용할 수 있는 것이다. (후자의 경우 이베이가 글로벌 시장을 공략함에 있어 다양한 언어를 지원하는데 활용하고 있는 방식이다.)

티어 1: 이 층위는 ML용도로 최적화된 클라우드 하드웨어나 마이크로소프트의 코그니티브 툴킷(Cognitive Tool Kit) 등의 도구들을 새로운 독자 영역 특화적 모델 구축 역량을 갖춘 개발자들에게 전달하는 단계다. 이는 업계의 용어를 빌리자면 ‘말은 쉽지만 현실은 녹록하지 않은’ 과정이다. 작업 수행을 위해 ML, 컴퓨터 아키텍츠, 시스템 최적화에 대한 종합적인 전문성을 필요로 하기 때문이다.

관련 사례로 리는 자신들의 파트너 중 한 곳인 UPMC 엔터프라이즈(UPMC Enterprises)를 언급했다. UPMC 엔터프라이즈는 비영리 의료 전달 서비스 단체인 피츠버그 대학 의료 센터의 수익 창출 부문이다. 이들 기관이 구축 중인 모델의 세부 사항에 관해서는 공개가 어렵지만, 리에 따르면 이 모델은 기관 의료진들의 환자 관리 성과 개선을 목표로 삼고 있다.

UPMC는 개발팀을 이끌며 프로젝트를 주도할 책임자로 ML분야의 전문가인 아담 버거 박사를 영입했다. 모델의 개발과 트레이닝, 기능 검증을 마친 후 UPMC는 이를 타 의료 기관들에도 상용 공개할 계획이다. 모델이 시장에 공개되면 마이크로소프트가 지원해온 140여 개국 16만 8,000에 이르는 생산성, IT 부문 고객들의 서비스 이용이 가능해질 것이다.

참고로 피츠버그는 유수의 의료 교육, 연구 기관들이 자리한 대규모 의료 커뮤니티의 중심이며, 카네기 멜른 대학을 거점으로 AI, ML 관련 연구 역시 활발히 이뤄지고 있는 지역이다.

티어 2: 티어 2는 세계 포커 랭커들을 물리친 카네기 멜른 대학의 리브라투스(Libratus) 포커봇과 바둑기사 이세돌과의 대국에서 승리한 구글 알파고(AlphaGo) 봇이 속한, 인공 종합 지능(AGI, Artificial General Intelligence)가 지칭되는 층위다.

AGI라는 표현은 인간의 모든 지적 과제를 수행할 수 있는 기계지능을 의미하는 가설 용어로, 관련 연구자 및 SF작가들에 의해 논의되어 온 개념이다. 위의 게임봇들은 게임이라는 특정 영역에서만 기능하는 좁은 의미의 AGI지만, 인간 경험에 제한되지 않고 자체 학습이 가능한 봇이라는 점에서 위의 티어들과 차별화된다.

대다수 ML모델들의 훈련 방식이란 이미지를 비롯한 기존 콘텐츠를 기반으로 인간의 지능을 모방하는 형태였다. 공공 인터넷의 1/3을 스캔하며 학습하는 구글의 자연어 번역기가 그 대표적인 사례다. 이러한 방식으로 ML 포커봇을 개발한다면, 수 백만 포커 플레이어들의 수 십억 건의 게임 기록을 분석해 인간 행동 양식을 모방한 모델을 개발하는 방식으로 학습이 이뤄졌을 것이다. 이와 달리 리브라투스는 가능한 모든 게임 상황을 실험해 포커의 승리 규칙을 학습하는 방식으로 기능한다.

알파고의 학습 전략 역시 이와 유사하다. 알파고는 인간의 지능에 국한되지 않는 플레이 스타일을 개발해 구사 함으로서 상대인 이세돌을 당황시킨 바 있다. 리는 나델라와의 대화에서 리브라투스와 알파고의 사례를 언급 함으로서 좁은 의미로나마 AGI 구현이 가능하게 됐음을 설명했다.

ML 상용화를 꿈꾸는 기업들이 마주한 문제
기업 환경에 ML의 효익을 전달하기 위한 공급망에는 한가지 문제가 존재한다. 리는 자연어 번역 등 머신러닝 모델들의 제작 주체가 전문가들로 구성된 특수 팀이라는 점을 언급했다. 이 조직은 머신러닝, 선형 대수학, 확률론 등과 관련한 고도의 전문성을 지닌 집단으로, 대부분 유수 대학의 박사 출신으로 구성돼 있다. 그리고 이처럼 소수의 전문 인력 풀을 유치, 운영할 수 있는 기업은 페이스북이나 구글, IBM, 마이크로소프트 등 극히 일부에 불과한 것이 현실이다.

어떻게 이와 같은 소규모 인력 집단만으로 상용 AI를 전달할 지의 여부가 리가 고민하는 핵심이다. 이들 인력이 힘들게 개발한 ML모델은 상급 연구원들에 의해 1차 검증을 거치고, 이후 ML 및 컴퓨터 시스템 전문가들에 의해 시장의 상용 하드웨어들에서 구동될 수 있도록 최적화가 이뤄진다. 그리고 마지막 단계로 고도의 전문성을 갖춘 개발자들이 참여해 리소스를 소모하는 컴포넌트들을 빠른 네이티브 코드로 재작성 해 최적의 비용 효율성을 보장하는 과정을 거친 후에야 실제적인 이용이 가능해진다.

ML 개발 툴은 고도의 복잡성을 지니며, 그 방법론은 여전히 낮은 성숙도에 머무르는 것이 현실이다. 모두 숙련도 낮은 개발자들의 모델 개발 참여를 제한하는 요인들이다.

AI의 가치 전달을 위한 마이크로소프트의 계획
현재 유의미한 활용이 이뤄지고 있는 것은 티어 0뿐이다. 마이크로소프트는 인지 서비스 API(Cognitive Services API) 및 기성 애플리케이션들에 자연어 처리, 텍스트 분석, 언어 번역 등의 기능추가를 지원하는 사전 학습 모델 클라우드 포트폴리오를 운영 중이며, 현재 그것의 이용 고객은 수 천명 규모이다.

티어 1의 경우에는 위 전문 인력 풀의 참여가 필수적으로 요구되는 영역이며, 일반 개발자들이 모델 개발에 활용할만한 성숙한 도구들이 확보되지 않은 관계로 아직 확산에 제약을 받고 있다. 리에 따르면 마이크로소프트는 지난 20년 간 진행해온 AI 연구를 활용해 파트너들의 독자적 ML 모델 개발을 지원함으로써 새로운 문제 해결에 기여할 계획을 세우고 있다.

리는 “티어 1은 우리의 파트너들이 보다 나은 성과를 거둘 수 있는 영역이다. 각 파트너들이 보유한 자신들의 영역에서의 전문성을 ML 분야에 적용한다면, 검증 문제 해결이 가능한 독자적 모델을 개발하고 그것을 산업 전반에 상용화하는 것이 가능하다. 현재 UPMC가 자신들의 개발품을 의료 산업 전반에 판매할 계획을 세우고 있는 것과 같은 원리다”라고 설명했다.

이어 그는 “우리는 UPMC 엔터프라이즈와 같은 수직 산업들의 기회 발굴 과정에 투자를 진행할 용의가 있다. 우리는 파트너 기업의 엔지니어들을 마이크로소프트 실험실로 초대하고, 그들이 우리의 연구진과 협업해 독자적 모델을 개발할 수 있도록 지원할 것이다. 이어 검증된 모델이 불륨화를 거쳐 수직 산업 전반에 상용화된다면, 우리 마이크로소프트로서는 해당 모델들의 학습 및 구동을 지원하는 ML 특화적 클라우드 하드웨어의 사용자 집단을 확보하게 되는 것이다”라고 덧붙였다.

리는 “개인적으로는 우리의 오픈소스 코그리니브 툴킷을 사랑하지만, 구글의 텐서플로(TensorFlow)나 페이스북 카페 2(Caffe 2) 라이브러리가 보다 적합한 기업 환경이라면 이 역시 충분히 지지한다. 결국 우리 미래 전략의 성패는 발머 은퇴 이후 우리가 내세우고 있는 ‘오픈-마이크로소프트 클라우드’라는 맥락 속에서 마이크로소프트 클라우드 비즈니스에 전해지는 영향력에 좌우될 것이기 때문이다”라고 이야기했다.

한편 티어 2 모델은 마이크로소프트가 지속적인 관심을 보일 연구 주제이며, AGI를 향한 장기적 행보를 위한 측정의 지표로 기능할 전망이다.

이르면 5년 내 보다 많은 컴퓨터 과학 전공생들이 AI 및 ML 학습에 참여하고, 그로써 전문가 풀이 확대되는 흐름을 만나보게 될 것이다. 더불어 한층 성숙한 툴체인의 등장으로 모델 개발의 기회가 보다 많은 개발자들에게 열리는 것도 상상해볼 수 있겠다. 동시에 현세대의 소수 전문가들 역시 우리에게 보다 큰 영향을 전해줄 각종 연구를 꾸준히 진행해나갈 것이다.

* 스티븐 맥스 패터슨은 소프트웨어 개발 플랫폼, 모바일, IoT, 웨어러블 및 차세대 텔레비전 트렌드에 대해 저술하는 20년 경력의 전문 기고가다. ciokr@idg.co.kr 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.