Offcanvas

AI / 디지털 트랜스포메이션 / 로봇|자동화 / 머신러닝|딥러닝 / 비즈니스|경제 / 신기술|미래

달아오르는 AI 전장 ··· IT 거대 기업들의 다음 수(手)는?

2017.05.26 Peter Sayer  |  IDG News Service


여기에는 음성을 텍스트로 변환하고, 의도를 파악하고, 오탈자를 수정하고, 음성과 텍스트를 번역하고, 학술 논문과 저자, 논문이 발행된 저널의 관계를 파악하는 도구 등이 있다. 또 챗봇을 구현, 슬랙과 트위터, 오피스 365 메일 등 서비스와 연결할 수 있는 봇 프레임워크 (Bot Framework)라는 서비스도 있다. 여기에 더해, 기업이 보유한 빅데이터 세트를 이용, 자신의 딥러닝 시스템을 훈련시키기 위해 다운로드 받을 수 있는 오픈소스 툴킷을 제공하고 있다.

마이크로소프트는 5월 초 빌드(Build)에서 프리뷰 단계였던 몇몇 서비스를 공식 데뷔시켰다. 여기에는 얼굴을 인식해 태그하는 API, 텍스트와 이미지, 비디오를 승인 또는 차단하고, 어려운 경우 사람이 검토할 수 있도록 넘기는 자동 콘텐츠 모더레이터(Content Moderator) 등이 포함되어 있다. 또 기업이 공장에서 사용하는 부품 등 자신에게 중요한 물체를 인식하도록 훈련시킬 때 사용할 수 있는 맞춤형 이미지 인식 서비스도 있다.

구글은 내부에서 사용하는 수 많은 머신러닝 기술을 구글 클라우드 플랫폼(Google Cloud Platform)의 일부로 제공하고 있다. 특정 작업용으로 훈련된 시스템, 이미지와 텍스트, 비디오 분석, 음성 인식, 번역 등 자신의 데이터로 훈련 시킬 수 있는 시스템이 있다. 또 텍스트에서 의미와 감성을 추출할 수 있는 자연어 처리 도구도 있다. 챗봇이나 콜 센터에 사용할 수 있는 도구다. 심지어는 지역과 경력, 스킬을 기준으로 구직자와 일자리를 연결하는 구인구직 도구도 있다.

아마존 웹 서비스의 경우, 기업들이 아마존 에코 장치에 탑재된 디지털 가상 비서 알렉사 용으로 새로운 '스킬'이나 음성 앱을 개발할 수 있다. 또 알렉사 기반 기술 가운데 상당수를 '클라우드 서비스(as a service)'로 제공한다.

가장 최근 등장한 클라우드 서비스(as a service)는 통화와 분을 기준으로 과금을 하는 아마존 커넥트(Amazon Connect)다. 이를 아마존 음성 인식 및 이해 서비스와 통합, 더 정교한 IVR(Interactive Voice Response) 시스템을 개발할 수 있다.

미래에 도래할 기술들
지금까지 상용화 단계의 서비스를 소개했다. 그러나 이 밖에도 미래에 구현될 기술들이 많다.

예를 들어, 마이크로소프트는 몇몇 기업을 대상으로 다른 서비스들의 '프리뷰' 버전을 테스트하고 있다. 사진 속 사람 얼굴 표정에서 감정을 분석, 분노와 경멸, 모욕, 공포, 행복, 슬픔, 놀람 등으로 분류하는 이미지 분석 도구 이모션 API(Emotion API)를 예로 들 수 있다. (셀카 사진을 보내 직접 시험해볼 수 있다.)

이 밖에 회사의 음성 인식 도구가 있는데, 이는 기업들이 지역이나 환경에 맞춰 엔진을 조정할 수 있도록 개발되고 있다. 더 나아가 화자를 식별할 수도 있는 것으로 전해지고 있다.

챗봇에 사용하는 새로운 도구인 QnA 메이커(QnA Maker)는 콘텐츠에서 FAQ를 추출 해 답을 제공할 수 있게 해준다. 아직까지는 결과물이 신통치 않다. 그러나 이는 QnA 메이커보다는 소스 문제일 확률이 높다. 아직 10억 개의 FAQ를 읽어 학습하지 않았다는 의미다.

구글은 3월 샌프란시스코에서 열린 구글 클라우드 넥스트(Cloud Next) 2017 컨퍼런스에서 명사나 동사를 검색해 관련된 비디오 클립을 찾을 수 있는 '클라우드 비디오 인텔리전스 API 프라이빗 베타 테스트(private beta test of its Cloud Video Intelligence API)'를 공개했다.

구글은 기업이 구글 전문가와 당문 문제에 머신러닝을 활용할 수 있도록 지원하는 캘리포니아 마운틴 뷰 소재 MLASL(Machine Learning Advanced Solutions Lab) 운영함으로써 향후 서비스 수요를 촉진시킨다는 계획이다.

이 밖에 이 회사는 최근 개최한 구글 I/O 행사에서 휴대폰용 텐서플로 라이트(TensorFlow Lite) 플랫폼과 머신러닝 워크로드 운영을 강화시킨 프로세서인 클라우드 TPU(Tensor Processing Unit)를 선보였다. 또 내부에서 사용하고 있는 일부 머신러닝 API의 세부 정보를 공개했다.

한편 AI를 연구하는 몇몇 대기업은 결과를 공개하고, 개발한 코드 상당수를 오픈소스 라이선스로 제공하려는 의지를 보이고 있다. 심지어 비밀 유지로 악명 높은 애플조차 지난해 말 처음으로 AI 연구 보고서를 발표했다.

그러나 '중요한 보물'들은 공개되지 않는 경우가 많다. 이들 기업들의 여러 머신러닝 도구들과 클라우드 서비스는 모두 유용할 수 있지만, 훈련시키지 않은 신경망은 기업 입장에서 정규 과정을 마치지 않은 16살 직원의 역할 밖에 못한다.

이로 인해 구글과 페이스북, 아마존, 심지어 애플과 마이크로소프트도 커즈웨일이 말한 ‘10억 개의 보기’를 각자 수집하고 있다. 클릭한 검색 결과, 승인한 쇼핑 추천, 태그 한 사진, 요청한 스포츠 경기 결과가 데이터에 추가된다.

물론 10억 개의 보기가 필요 없는 때도 있다. 훨씬 적은 데이터로 컴퓨터가 사람만큼 능력을 발휘할 수 있는 일들이 있다. 많은 일들이 적은 데이터로 충분하다. 특히 컴퓨터가 스스로 처리할 수 없는 상황을 사람에게 넘길 능력을 갖고 있다면 더욱 그렇다.

바로 옆에서 돕는 AI
AI에 기반을 둔 챗봇을 개발하고 있는 기업 상당수가 기대하는 지점이 여기다. 데이터 포인트가 10억 개에 훨씬 못 미치는 경우가 많다. 이들 기업들은 그러나 그러나 마이크로소프트 QnA 메이커 같은 서비스가 새로운 방식으로 고객에게 서비스를 제공할 수 있도록 도울 것이라고 믿고 있다.

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.