2018.05.17

'인공지능, 감쪽같이 대화하다'··· 구글 듀플렉스란?

Martyn Casserly | PC Advisor
구글이 회사의 디지털 비서에 전화를 걸어 상대방과 대화할 수 있는 기능을 최근 공개했다. '구글 듀플렉스'(Google Duplex)라는 이름의 이 기능에 대한 정보를 정리했다.

가상비서의 영역이 확장됐다. 날씨나 교통 상황, 인근 식당에 대한 정보를 알려주는 것에 대해 전화를 걸고 예약하는 재주까지 갖춘 것이다. 구글은 최근 개최한 구글 I/O 컨퍼런스에서 인간 상대방과 자연스럽게 통화하는 구글 듀플렉스를 시연했다.



전화를 건다는 의미는?
구글 듀플렉스는 안드로이드 또는 iOS 기기에 설치할 수 있는 구글 어시스턴트 앱의 확장 프로그램이다. 사용자는 구글 어시스턴트에게 식상이나 매장에 전화를 걸도록 한느 것을 포함해 여러 업무를 시킬 수 있다.

지시를 내리면 듀플렉스는 전화를 걸어 상대방과 실시간으로 대화를 나눈다. SF 영화에서 나온 것처럼 들리는 이야기지만 꽤 자연스럽게 이뤄진다. 구글 측은 통화 상대방이 사람과 대화하는 것으로 느끼게 될 것으로 자신하고 있다.

구글 순다 피차이 CEO는 구글 듀플렉스의 통화 사례를 녹음해 제시하기도 했다. 첫 번째 예는 듀플렉스가 미용사에게 전화를 걸어 특정 날짜와 시간에 예약하는 것이었는데, 해당 통화에서 듀플렉스는 '음', '아'와 같은 감탄사를 발하기도 하고 목소리 톤을 바꾸기도 해 관객의 이목을 집중시켰다.

두 번째 예는 좀더 인상적이었다. 강한 액센트를 가진 사람이 식당에서 약간 어색한 태도로 대답하는 상황을 연출했다. 필요한 정보를 해독했을 뿐 아니라, 사람에 따라서는 어려울 수도 있는 대화를 쉽게 처리했던 것이다.

구글 듀플렉스의 동작 방법
구글은 듀플렉스가 작업을 선별적으로 수행하도록 함으로써 길을 잃거나 혼동에 빠지지 않도록 했다. 서비스 관련 대화에만 집중시킨 것이다. 구글은 이에 대해 다음과 같이 설명했다.

"이 기술은 특정 유형의 약속을 예약하는 것과 같은 특정 작업에 맞춰 진행된다. 핵심 연구 정보 중 하나는 듀플렉스를 좁은 영역으로 제한하는 것이었다. 듀플렉스는 이러한 영역에서 깊이 훈련받은 후에만 ​​자연스러운 대화를 수행할 수 있다. 즉 일반적인 대화를 수행할 수는 없다."

듀플렉스의 핵심에는 구글이 RNN(Recurrent Neural Network)이라고 부르는 존재가 있다. RNN은 발화된 단어 뿐 아니라 각 단어가 활용되는 맥락까지도 처리한다. 구글은 다음과 같이 소개했다.

"고정밀 데이터를 얻기 위해 구글은 듀플렉스의 RNN을 익명화된 데이터 통화 데이터 뭉치를 통해 훈련시켰다. 이 네트워크는 구글의 ASR(automatic speech recognition) 기술 출력물을 활용했으며 오디오, 대화의 내역, 대화의 매개 변수(예 : 원하는 서비스 약속 또는 현재 시간 등)과 같은 것도 고려했다. 우리는 이해 모델을 각 업무에 맞춰 별도로 훈련시켰지만, 여러 업무에 공통된 공유 대화 뭉치가 활용되기도 했다."


구글 듀플렉스는 회사의 자동 음성 인식(ASR) 기술의 출력물을 활용하는 신경망에 기반하고 있다.

구글 듀플렉스는 지난 구글 I/O 컨퍼런스에서만 등장한 상태다. 회사는 제한된 사용자들이 올 여름께 실제 실험해볼 수 있을 것이라고 전했다.

조금은 오싹한 이야기?
이번 시연의 기술적 성과가 놀랍지만 윤리적 논란이 이미 제기되고 있다. 대화에서 앞서 듀플렉스와 같은 디지털 비서는 자신의 정체를 미리 밝혀야 할까? 예약에 오류가 발생하면 누가 책임져야 할까?

구글이 듀플렉스의 영역을 스케줄링 약속에 제한한 것도 이러한 논란 가능성을 감안한 것으로 보인다. 일부 혼란이 발생할 수는 있어야 심각한 수준은 아닐 것이기 때문이다.

기술적, 윤리적 문제가 해결된다면 스마트폰을 열어 25일 어벤저스 영화를 예매하도록 지시하는 날이 올 것이다. 그러면 듀플렉스가 극장에 전화를 걸고 또다른 듀플렉스와 대화를 나누게 될 것이다.

더글라스 아담스는 인간이 TV에 지루해하고 스스로를 위한 쇼를 볼 수 있도록 하는 기기가 발명될 미래에 대해 저술했던 바 있다. 그의 예측은 개인용 비디오 레코더로 현실화됐다. 인간이 진부한 대화로부터 벗어날 시점이 그리 멀지 않은 것처럼 보인다. ciokr@idg.co.kr 



2018.05.17

'인공지능, 감쪽같이 대화하다'··· 구글 듀플렉스란?

Martyn Casserly | PC Advisor
구글이 회사의 디지털 비서에 전화를 걸어 상대방과 대화할 수 있는 기능을 최근 공개했다. '구글 듀플렉스'(Google Duplex)라는 이름의 이 기능에 대한 정보를 정리했다.

가상비서의 영역이 확장됐다. 날씨나 교통 상황, 인근 식당에 대한 정보를 알려주는 것에 대해 전화를 걸고 예약하는 재주까지 갖춘 것이다. 구글은 최근 개최한 구글 I/O 컨퍼런스에서 인간 상대방과 자연스럽게 통화하는 구글 듀플렉스를 시연했다.



전화를 건다는 의미는?
구글 듀플렉스는 안드로이드 또는 iOS 기기에 설치할 수 있는 구글 어시스턴트 앱의 확장 프로그램이다. 사용자는 구글 어시스턴트에게 식상이나 매장에 전화를 걸도록 한느 것을 포함해 여러 업무를 시킬 수 있다.

지시를 내리면 듀플렉스는 전화를 걸어 상대방과 실시간으로 대화를 나눈다. SF 영화에서 나온 것처럼 들리는 이야기지만 꽤 자연스럽게 이뤄진다. 구글 측은 통화 상대방이 사람과 대화하는 것으로 느끼게 될 것으로 자신하고 있다.

구글 순다 피차이 CEO는 구글 듀플렉스의 통화 사례를 녹음해 제시하기도 했다. 첫 번째 예는 듀플렉스가 미용사에게 전화를 걸어 특정 날짜와 시간에 예약하는 것이었는데, 해당 통화에서 듀플렉스는 '음', '아'와 같은 감탄사를 발하기도 하고 목소리 톤을 바꾸기도 해 관객의 이목을 집중시켰다.

두 번째 예는 좀더 인상적이었다. 강한 액센트를 가진 사람이 식당에서 약간 어색한 태도로 대답하는 상황을 연출했다. 필요한 정보를 해독했을 뿐 아니라, 사람에 따라서는 어려울 수도 있는 대화를 쉽게 처리했던 것이다.

구글 듀플렉스의 동작 방법
구글은 듀플렉스가 작업을 선별적으로 수행하도록 함으로써 길을 잃거나 혼동에 빠지지 않도록 했다. 서비스 관련 대화에만 집중시킨 것이다. 구글은 이에 대해 다음과 같이 설명했다.

"이 기술은 특정 유형의 약속을 예약하는 것과 같은 특정 작업에 맞춰 진행된다. 핵심 연구 정보 중 하나는 듀플렉스를 좁은 영역으로 제한하는 것이었다. 듀플렉스는 이러한 영역에서 깊이 훈련받은 후에만 ​​자연스러운 대화를 수행할 수 있다. 즉 일반적인 대화를 수행할 수는 없다."

듀플렉스의 핵심에는 구글이 RNN(Recurrent Neural Network)이라고 부르는 존재가 있다. RNN은 발화된 단어 뿐 아니라 각 단어가 활용되는 맥락까지도 처리한다. 구글은 다음과 같이 소개했다.

"고정밀 데이터를 얻기 위해 구글은 듀플렉스의 RNN을 익명화된 데이터 통화 데이터 뭉치를 통해 훈련시켰다. 이 네트워크는 구글의 ASR(automatic speech recognition) 기술 출력물을 활용했으며 오디오, 대화의 내역, 대화의 매개 변수(예 : 원하는 서비스 약속 또는 현재 시간 등)과 같은 것도 고려했다. 우리는 이해 모델을 각 업무에 맞춰 별도로 훈련시켰지만, 여러 업무에 공통된 공유 대화 뭉치가 활용되기도 했다."


구글 듀플렉스는 회사의 자동 음성 인식(ASR) 기술의 출력물을 활용하는 신경망에 기반하고 있다.

구글 듀플렉스는 지난 구글 I/O 컨퍼런스에서만 등장한 상태다. 회사는 제한된 사용자들이 올 여름께 실제 실험해볼 수 있을 것이라고 전했다.

조금은 오싹한 이야기?
이번 시연의 기술적 성과가 놀랍지만 윤리적 논란이 이미 제기되고 있다. 대화에서 앞서 듀플렉스와 같은 디지털 비서는 자신의 정체를 미리 밝혀야 할까? 예약에 오류가 발생하면 누가 책임져야 할까?

구글이 듀플렉스의 영역을 스케줄링 약속에 제한한 것도 이러한 논란 가능성을 감안한 것으로 보인다. 일부 혼란이 발생할 수는 있어야 심각한 수준은 아닐 것이기 때문이다.

기술적, 윤리적 문제가 해결된다면 스마트폰을 열어 25일 어벤저스 영화를 예매하도록 지시하는 날이 올 것이다. 그러면 듀플렉스가 극장에 전화를 걸고 또다른 듀플렉스와 대화를 나누게 될 것이다.

더글라스 아담스는 인간이 TV에 지루해하고 스스로를 위한 쇼를 볼 수 있도록 하는 기기가 발명될 미래에 대해 저술했던 바 있다. 그의 예측은 개인용 비디오 레코더로 현실화됐다. 인간이 진부한 대화로부터 벗어날 시점이 그리 멀지 않은 것처럼 보인다. ciokr@idg.co.kr 

X