2017.05.26

달아오르는 AI 전장 ··· IT 거대 기업들의 다음 수(手)는?

Peter Sayer | IDG News Service

인공지능(AI) 경쟁이 뜨겁게 달아오르고 있다. 이달만 해도 마이크로소프트와 구글은 각자의 개발자 컨퍼런스인 빌드(Build)와 I/O에서 엔터프라이즈 시장을 대상으로 상시 사용할 수 있는 강력한 AI도구들을 선보였다.

AI는 이제 개발 단계를 넘어섰다. AI소프트웨어는 체스를 둘 수 있고, 몇몇 레트로 게임에서는 사람보다 더 능숙하게 게임을 한다. 심지어는 자동차도 운전한다. 빌드와 I/O 컨퍼런스에서 증명되었듯, 실험/시험실에서 실제 세상으로 나온 연구들이 증가하고 있다.

애플 시리, 마이크로소프트 코나타, 아마존닷컴 알렉사, 삼성전자 빅스비 등 현존하는 가상비서의 AI기반 음성 기술은 초인 같은 능력을 제공하지 않지만, 대신 수퍼컴퓨터보다 훨씬 더 적은 전력과 성능만 요구한다. 덕분에 이제 AI에의 문턱이 훨씬 낮아졌다. 아마존 에코(Echo)를 갖고 있는 사람들이 고객 센터에 전화를 걸지 않아도 아마존과 대화할 수 있는 알렉사 기능을 예로 들 수 있다. 또는 다양한 클라우드 기반 음성 인식과 TTS(Text to Speech, 음성 합성) 서비스를 이용, 독자적으로 자동화 된 콜 센터를 구축할 수 있다.

초기 AI연구들은 인간의 지식을 컴퓨터가 이해하고, 이것이 불가능할 경우 추론할 수 있게 모델화하는 것을 추구했었다. 이를 통해 1세대 텍스트 기반 '전문가 시스템'(expert systems)이 등장했다. 그러나 초기 시스템은 사람처럼 경험을 통한 학습으로 전문성을 축적하지 못했다. 대신 내재 지식을 외재 규칙으로 주입하는 방식으로 경험을 직접 공급해야 했다.

그러다 최근 몇 년 간 AI연구가 크게 발전했다. 엔터프라이즈(기업)에 가장 유용하게 응용할 수 있는 기술 발전은 경험으로 지식을 얻는 머신러닝의 출현이다. 지난해 구글의 자회사인 딥마인드(DeepMind)가 개발한 프로그램인 알파고(AlphaGo)가 바둑 세계 대회에서 18번이나 우승한 이세돌을 4대1로 이긴 것이 머신러닝의 발전을 보여주는 사례다.

머신러닝은 신경 세포(뉴런)이 신체 곳곳에 정보를 전달하는 방식을 모방한 컴퓨팅 모델인 신경망 기술이 등장하면서 시작됐다. 사람의 뇌에는 약 1,000억 개의 뉴런이 있고, 이들 뉴런은 약 1,000개의 다른 뉴런과 연결되어 있다.

인공 신경망은 이들 세포군을 모델화 한 것이다. 이들 세포에는 각각 인풋(유입되는 데이터)과 아웃풋(데이터를 처리 또는 계산한 결과)이 있다. 신경은 계층으로 구성되어 있으며, 각 계층은 앞 계층에서 인풋을 받고, 다음 계층으로 아웃풋을 전달한다. 신경망이 집단으로 문제를 해결할 때, 답을 정확히 예측하는 신경의 아웃풋에 가중치를 주며, 이를 통해 신경망이 학습을 한다.

계층이 많은 신경망(딥 신경망)이 더 정확하다. 단 여기에는 많은 컴퓨팅 자원(비용)이 요구된다. 초기에는 구현이 불가능했을 정도이다. 하지만 디스플레이에 사용됐던 GPU의 병렬 처리 기능에 대한 연구가 이를 해결했다.



트랜지스터, 스스로 학습하다
이런 기술 발전이 기업에 빅데이터 문제를 극복할 새로운 방법을 제공하고 있다. 그러나 (어느 정도는) 필요한 기술을 만들기 위해 빅데이터 문제 자체를 해결해야 하는 아이러니가 아직 존재한다.

사람의 강점 중 하나는 몇몇 본보기만 가지고 학습을 할 수 있다는 것이다. 3월 세빗 글로벌 컨퍼런스(Cebit Global Conference)에서 구글의 레이 커즈웨일 엔지니어링 디렉터는 "인간은 상사가 무언가를 한두 차례 말하면, 그것을 학습할 수 있다. 이것이 인간 지능의 강점 중 하나다. 그러나 딥 러닝 분야 종사자들은 '10억 개의 보기가 있어야 생명이 시작된다'라고 말하곤 한다"라고 설명했다. 다시 말해, 딥 신경망 같은 머신러닝 기술이 사람 만큼 효과적으로 학습을 하려면 10억 차례의 행동과 작업을 관찰해야 한다.

즉, 10억 개의 본보기를 찾는 것 자체가 문제가 된다. 알파고 개발자들은 13 계층의 신경망을 훈련시키기 위해 사람들의 바둑 대결 데이터 수천 개를 인터넷에 찾아 활용했다. 그러나 기능이 향상되면서, 다른 알파고 버전과 대결을 시켜 새로운 게임 데이터를 생성했다.

알파고는 두 종류의 머신러닝으로 대결에서 승리했다. 사람들의 바둑 대결 데이터는 인풋 데이터에 신경망이 학습해야 하는 대응(응답)을 태그 한 지도(Supervised) 학습을 이용해 분석했다. 바둑 대결의 경우 승리할 수 있는 다음 수(手)이다.

그리고 다른 버전의 알파고와 플레이를 하는 경우에는 강화(Reinforcement) 학습을 이용했다. 대결에서 이기는 것이 목적이지만, 인풋 데이터가 없는 방식이다. 이후 알파고를 방치해 스스로 데이터를 생성해 평가하도록 만들었다. 여기에는 뉴런이 지도 학습망과 동일한 가중치를 출발점으로 삼지만, 점진적으로 수정을 해서 사람을 능가하는 전략을 찾을 수 있는 두 번째 신경망을 이용했다.

3번째 기법인 비 지도(Unsupervised) 학습은 비즈니스에 유용하지만, 바둑과 같은 게임에는 유용성이 다소 떨어진다. 이 기법에서는 신경망에 목표에 대한 정보를 제공되지 않으며 대신 스스로 데이터 세트를 탐구, 데이터를 분류하고 상관관계를 파악하도록 만든다.

이 방식으로 이용되는 머신러닝의 경우 또 다른 분석 도구가 될 수 있다. 게임을 여러 가지 방식으로 플레이되거나 끝날 수 있음이 규명되는 것이다. 이에 대한 최종 판단은 사람이 내리게 된다.

다양한 요소 서비스의 등장
엔터프라이즈 애플리케이션과 서비스에 사용할 수 있는 AI의 빌딩블록(구성 요소)을 제공하는 크고 작은 회사들이 많다. 규모가 작은 회사들은 구체적인 영역이나 산업에 초점을 맞추는 경향이 있다. 반면 규모가 큰 회사들은 큰 그림, 범용 애플리케이션에 활용할 수 있는 도구에 초점을 맞춘다.

AI 하면 가장 먼저 떠올리는 벤더 중 하나가 IBM이다. 왓슨(Watson) 덕분이다. 단 IBM은 AI 대신 '인지 컴퓨팅'이라는 표현을 선호한다. 왓슨은 챗봇을 만들고, 텍스트 데이터의 패턴과 구조를 발견하고, 비구조화 텍스트 데이터에서 지식을 추출할 수 있는 다양한 도구들로 구성되어 있다. IBM은 또 의료, 교육, 금융 서비스, 상업, 마케팅, 공급망 지원 등 특정 산업 부문 사용자에게 정보를 제공할 수 있도록 왓슨을 훈련시켰다.

IBM과 파트너들은 이를 기존 비즈니스 프로세스와 통합시킬 수 있도록 했다. 또 개발자 스스로 추가 개발을 할 수 있는 도구를 제공하기도 한다. IBM 블루믹스(Bluemix) 클라우드 서비스 포털에서 대부분의 도구를 API로 입수할 수 있다.

마이크로소프트도 '인지'라는 표현을 좋아한다. 이 회사는 마이크로소프트 인지 서비스(Microsoft Cognitive Services)라는 브랜드를 통해 개발자들에게 머신러닝 기술을 애플리케이션에 통합할 수 있는 API를 제공하고 있다.




2017.05.26

달아오르는 AI 전장 ··· IT 거대 기업들의 다음 수(手)는?

Peter Sayer | IDG News Service

인공지능(AI) 경쟁이 뜨겁게 달아오르고 있다. 이달만 해도 마이크로소프트와 구글은 각자의 개발자 컨퍼런스인 빌드(Build)와 I/O에서 엔터프라이즈 시장을 대상으로 상시 사용할 수 있는 강력한 AI도구들을 선보였다.

AI는 이제 개발 단계를 넘어섰다. AI소프트웨어는 체스를 둘 수 있고, 몇몇 레트로 게임에서는 사람보다 더 능숙하게 게임을 한다. 심지어는 자동차도 운전한다. 빌드와 I/O 컨퍼런스에서 증명되었듯, 실험/시험실에서 실제 세상으로 나온 연구들이 증가하고 있다.

애플 시리, 마이크로소프트 코나타, 아마존닷컴 알렉사, 삼성전자 빅스비 등 현존하는 가상비서의 AI기반 음성 기술은 초인 같은 능력을 제공하지 않지만, 대신 수퍼컴퓨터보다 훨씬 더 적은 전력과 성능만 요구한다. 덕분에 이제 AI에의 문턱이 훨씬 낮아졌다. 아마존 에코(Echo)를 갖고 있는 사람들이 고객 센터에 전화를 걸지 않아도 아마존과 대화할 수 있는 알렉사 기능을 예로 들 수 있다. 또는 다양한 클라우드 기반 음성 인식과 TTS(Text to Speech, 음성 합성) 서비스를 이용, 독자적으로 자동화 된 콜 센터를 구축할 수 있다.

초기 AI연구들은 인간의 지식을 컴퓨터가 이해하고, 이것이 불가능할 경우 추론할 수 있게 모델화하는 것을 추구했었다. 이를 통해 1세대 텍스트 기반 '전문가 시스템'(expert systems)이 등장했다. 그러나 초기 시스템은 사람처럼 경험을 통한 학습으로 전문성을 축적하지 못했다. 대신 내재 지식을 외재 규칙으로 주입하는 방식으로 경험을 직접 공급해야 했다.

그러다 최근 몇 년 간 AI연구가 크게 발전했다. 엔터프라이즈(기업)에 가장 유용하게 응용할 수 있는 기술 발전은 경험으로 지식을 얻는 머신러닝의 출현이다. 지난해 구글의 자회사인 딥마인드(DeepMind)가 개발한 프로그램인 알파고(AlphaGo)가 바둑 세계 대회에서 18번이나 우승한 이세돌을 4대1로 이긴 것이 머신러닝의 발전을 보여주는 사례다.

머신러닝은 신경 세포(뉴런)이 신체 곳곳에 정보를 전달하는 방식을 모방한 컴퓨팅 모델인 신경망 기술이 등장하면서 시작됐다. 사람의 뇌에는 약 1,000억 개의 뉴런이 있고, 이들 뉴런은 약 1,000개의 다른 뉴런과 연결되어 있다.

인공 신경망은 이들 세포군을 모델화 한 것이다. 이들 세포에는 각각 인풋(유입되는 데이터)과 아웃풋(데이터를 처리 또는 계산한 결과)이 있다. 신경은 계층으로 구성되어 있으며, 각 계층은 앞 계층에서 인풋을 받고, 다음 계층으로 아웃풋을 전달한다. 신경망이 집단으로 문제를 해결할 때, 답을 정확히 예측하는 신경의 아웃풋에 가중치를 주며, 이를 통해 신경망이 학습을 한다.

계층이 많은 신경망(딥 신경망)이 더 정확하다. 단 여기에는 많은 컴퓨팅 자원(비용)이 요구된다. 초기에는 구현이 불가능했을 정도이다. 하지만 디스플레이에 사용됐던 GPU의 병렬 처리 기능에 대한 연구가 이를 해결했다.



트랜지스터, 스스로 학습하다
이런 기술 발전이 기업에 빅데이터 문제를 극복할 새로운 방법을 제공하고 있다. 그러나 (어느 정도는) 필요한 기술을 만들기 위해 빅데이터 문제 자체를 해결해야 하는 아이러니가 아직 존재한다.

사람의 강점 중 하나는 몇몇 본보기만 가지고 학습을 할 수 있다는 것이다. 3월 세빗 글로벌 컨퍼런스(Cebit Global Conference)에서 구글의 레이 커즈웨일 엔지니어링 디렉터는 "인간은 상사가 무언가를 한두 차례 말하면, 그것을 학습할 수 있다. 이것이 인간 지능의 강점 중 하나다. 그러나 딥 러닝 분야 종사자들은 '10억 개의 보기가 있어야 생명이 시작된다'라고 말하곤 한다"라고 설명했다. 다시 말해, 딥 신경망 같은 머신러닝 기술이 사람 만큼 효과적으로 학습을 하려면 10억 차례의 행동과 작업을 관찰해야 한다.

즉, 10억 개의 본보기를 찾는 것 자체가 문제가 된다. 알파고 개발자들은 13 계층의 신경망을 훈련시키기 위해 사람들의 바둑 대결 데이터 수천 개를 인터넷에 찾아 활용했다. 그러나 기능이 향상되면서, 다른 알파고 버전과 대결을 시켜 새로운 게임 데이터를 생성했다.

알파고는 두 종류의 머신러닝으로 대결에서 승리했다. 사람들의 바둑 대결 데이터는 인풋 데이터에 신경망이 학습해야 하는 대응(응답)을 태그 한 지도(Supervised) 학습을 이용해 분석했다. 바둑 대결의 경우 승리할 수 있는 다음 수(手)이다.

그리고 다른 버전의 알파고와 플레이를 하는 경우에는 강화(Reinforcement) 학습을 이용했다. 대결에서 이기는 것이 목적이지만, 인풋 데이터가 없는 방식이다. 이후 알파고를 방치해 스스로 데이터를 생성해 평가하도록 만들었다. 여기에는 뉴런이 지도 학습망과 동일한 가중치를 출발점으로 삼지만, 점진적으로 수정을 해서 사람을 능가하는 전략을 찾을 수 있는 두 번째 신경망을 이용했다.

3번째 기법인 비 지도(Unsupervised) 학습은 비즈니스에 유용하지만, 바둑과 같은 게임에는 유용성이 다소 떨어진다. 이 기법에서는 신경망에 목표에 대한 정보를 제공되지 않으며 대신 스스로 데이터 세트를 탐구, 데이터를 분류하고 상관관계를 파악하도록 만든다.

이 방식으로 이용되는 머신러닝의 경우 또 다른 분석 도구가 될 수 있다. 게임을 여러 가지 방식으로 플레이되거나 끝날 수 있음이 규명되는 것이다. 이에 대한 최종 판단은 사람이 내리게 된다.

다양한 요소 서비스의 등장
엔터프라이즈 애플리케이션과 서비스에 사용할 수 있는 AI의 빌딩블록(구성 요소)을 제공하는 크고 작은 회사들이 많다. 규모가 작은 회사들은 구체적인 영역이나 산업에 초점을 맞추는 경향이 있다. 반면 규모가 큰 회사들은 큰 그림, 범용 애플리케이션에 활용할 수 있는 도구에 초점을 맞춘다.

AI 하면 가장 먼저 떠올리는 벤더 중 하나가 IBM이다. 왓슨(Watson) 덕분이다. 단 IBM은 AI 대신 '인지 컴퓨팅'이라는 표현을 선호한다. 왓슨은 챗봇을 만들고, 텍스트 데이터의 패턴과 구조를 발견하고, 비구조화 텍스트 데이터에서 지식을 추출할 수 있는 다양한 도구들로 구성되어 있다. IBM은 또 의료, 교육, 금융 서비스, 상업, 마케팅, 공급망 지원 등 특정 산업 부문 사용자에게 정보를 제공할 수 있도록 왓슨을 훈련시켰다.

IBM과 파트너들은 이를 기존 비즈니스 프로세스와 통합시킬 수 있도록 했다. 또 개발자 스스로 추가 개발을 할 수 있는 도구를 제공하기도 한다. IBM 블루믹스(Bluemix) 클라우드 서비스 포털에서 대부분의 도구를 API로 입수할 수 있다.

마이크로소프트도 '인지'라는 표현을 좋아한다. 이 회사는 마이크로소프트 인지 서비스(Microsoft Cognitive Services)라는 브랜드를 통해 개발자들에게 머신러닝 기술을 애플리케이션에 통합할 수 있는 API를 제공하고 있다.


X