2015.09.25

칼럼 | 성큼 도래한 유비쿼터스 AI 세상··· 마음의 준비를 'Her'하라

Mike Elgan | Computerworld

인공 지능이라는 낯선 존재를 대하는 속 편한 방법 중 하나는, 이를 그저 응접실의 장식품이나 신기한 장난감, 또는 괴상한 기계로 치부해버리는 것이다.

지난 주 마이크로소프트의 CEO 사티야 나델라는 자사의 가상 비서 코타나(Cortana)가 저지른 실수로 망신을 겪었다. 세일즈포스 닷컴의 드림포스(Dreamforce) 행사장을 찾은 나델라는 비즈니스 툴로서 코타나의 역량을 시연하는 자리를 가졌다.

나델라는 데모 버전의 코타나에게 “지금 가장 리스크가 큰 기회가 뭐지?”(Show me my most at-risk opportunities?)라는 질문을 던졌다. 그러나 코타나는 이 질문을 “지금 우유를 살만한 곳이 있을까?”(Show me to buy milk at this opportunity?)라고 인식해 나델라를 비롯한 현장의 모두를 당황케 했다.

하지만 이 에피소드는 코타나의 치명적인 결함이라기보단, 인터페이스의 오류로 보는 것이 옳을 것이다. 그리고 이번에 나델라가 시연한 코타나는 어디까지나 데모 버전이라는 점 역시 기억할 필요가 있다. (전문가로서 전하는 팁: 테크놀로지 이벤트 현장에서 조용히 무대에만 집중하는 사람은 찾아보기 힘들다. 음성 인식 시스템을 시연하고자 한다면 마이크는 필수다.)

미디어 대부분은 이 사건을 ‘사티야의 망신' 정도로 다뤘다. 그러나 사실 좀더 주목할 필요가 있는 것은 사티야가 코타나에게 던진 질문이다. 가상 비서 이면에 자리한 기술이 이제 기업의 리스크를 분석할 수 있는 수준까지, 다시 말해 우리가 상상하던 미래를 현실로 만들만한 수준까지 발전했다는 사실이다.

테크놀로지는 앞으로 우리의 삶을 때론 놀랍게, 또 때론 두렵게 바꿔나갈 것이다. 물론 대부분의 변화는 우리를 경탄하게 할 방향으로 이뤄질 것이다.

가상 비서의 진화는 계속될 것이고 우리는 그들과 대화를 나누며 실제 인간과 소통하는 것과 다르지 않은 감정을 느낄 것이다. 하나의 가상 비서를 구현하기 위해선 수많은 개별 기술들이 기능한다. ‘좋은’ 가상 비서를 판단하는 기준은 이 서로 다른 테크놀로지들이 얼마나 유기적으로 얽혀 하나의 경험을 구현하는지의 여부다. 여기 가상 비서를 구성하는 테크놀로지들을 살펴보자.

- 음성 인식: 사용자의 발화와 구어적 표현, 액센트를 인식하며 배경 음성과 비-발화적 음향을 구별해 배제할 수 있는 기술이다. 핵심은 사용자의 발화가 이어지는 순간에 그 정보를 실시간으로 처리할 수 있는 기술력에 있다.

- 파일 압축 및 전송: 음성 파일을 압축해 프로세싱을 담당하는 데이터센터로 전송하는 속도를 의미한다.

- 인공 지능(A.I.): 수집한 정보를 소프트웨어가 ‘이해’하고 거기에 어떤 정보를 제공해야 하는지를 결정하는 역량이다.

- 데이터 소스: 반응 통지를 위해 지식 기반이나 계산 엔진 등의 데이터에 접근하는 기능을 의미한다.

- 사용자 맥락: 이메일, 캘린더, 연락처, 지도, 검색 기록 등 현재 실행 중인 기능들에서 정보를 추출해내는 기능이다.

- 대화 엔진: 답변을 다변화하고 구어, 농담, 맥락 등을 응용할 수 있는 기능이다.

- 대행: 일정 추가나 메시지 전송, 상품 구매, 앱 실행 및 앱 내 기능 실행 등의 동작을 사용자 대신 수행할 수 있는 기능을 의미한다.

- 예측: 사용자의 지시 없이도 특정 활동을 진행하는 역량이다.

이 요소들 각각은 상호 독립적으로 동작하며, 그 기능을 위해 다양한 방법론과 테크놀로지의 지원을 받는다. 그리고 무엇보다 중요한 사실은, 이들 각각이 급격한 혁신을 이룩하며 각자의 시장을 형성해가고 있다는 점이다. 이제 기업들은 시장에서 이 기능들 가운데 자신들의 인터페이스나 상품에 필요한 요소들을 구매해 적용할 수도 있다.

예를 들어 애플의 가상 비서 시리가 음성 인식, 프로세싱, 인공 지능, 데이터 수용 네 영역에서 각각 25%씩의 기능 향상에 성공한다 상상해보자. 이는 향후 수 개월 이내에 달성 가능한 상상이다. 이 정도의 발전만으로도 시리는 현재와는 비교할 수 없을 정도의 기능성을 구현할 것이다.

과거의 가상 비서는 실용성과는 거리가 먼 장난감이었을지 모르지만, 불과 1~2년 만에 이는 컴퓨팅 인터페이스의 주축으로 자리를 잡아가고 있다.

아마존 파이어 TV나 애플의 신형 애플 TV처럼, 가상 비서를 제 1 인터페이스로 활용하는 사례도 하나 둘 나타나고 있다.

하운드(Hound)와 같은 강력한 신형 앱의 등장 또한 가상 비서 테크놀로지의 활성화에 기여하는 요인이다. 페이스북 메신저의 M 기능 역시 앱에 가상 비서 테크놀로지를 더한 좋은 사례다. 아마존 에코(Echo) 등의 가상 비서 설비 시장도 큰 폭의 성장이 예상되는 영역이다.

이러한 사례들은 단지 시작일 뿐이다. 머지 않은 미래 우리는 더욱 강력한 가상 비서들이 각종 기기와 설비의 주 인터페이스로 역할 하는 모습을 볼 수 있을 것이다.

A.I.는 인형 분야에서도 활약할 전망이다.

A.I. 크리스마스
마텔(Mattel)사는 최근 보도자료를 통해 새로운 버전의 바비 인형이 2개월 이내에 시장에 선을 보일 것이라 소개했다. 차세대 바비 인형은 정교한 인공 지능 엔진을 통해 아이들과 대화를 나누는 게 가능하다.



74.99 달러의 가격에 출시 예정인 헬로 바비(Hello Barbie)는 양 다리에 배터리가 내장되어 있으며, 등 아래쪽에 위치한 USB 포트를 통해 충전이 가능하다. 헬로 바비는 목걸이를 마이크로 이용하며 사용자는 벨트 버클에 위치한 버튼을 눌러 마이크를 활성화할 수 있다. 헬로 바비의 뇌 역할을 하는 소형 컴퓨터와 와이파이 안테나는 작은 머리가 아닌 몸통부분에 위치하게 된다.

사용자인 아이가 헬로 바비에게 말을 걸면, 바비는 해당 음성 파일을 녹취, 압축해 외부 서버(토이톡(ToyTalk)의 자체 데이터 센터)로 전송해 분석한다. 애플의 시리와 같은 형태의 운영 방식이다. 분석이 완료되면 그에 대한 적절한 응답을 구성해 다시 바비에게 전달되고 재생이 이뤄진다. 시리와 마찬가지로 바비가 하는 모든 말은 마텔에 의해 작성된다.

헬로 바비 프로젝트 공개 이후 대중의 반응은 뜨거웠다. 걱정 많은 언론들은 아이의 음성이 와이파이 네트워크를 통해 전달된다는 이 계획에 ‘소름 끼친다’, ‘도청의 위험이 있다’라는 식의 문제를 제기했다. 아동들의 프라이버시를 고려치 않는다는 것이 비판의 핵심이었다.

하지만 사실 이러한 인터페이스는 이미 아이들의 주변에 자리 잡고 있다. 인공 지능이라거나 가상 비서가 아닌 ‘친구’라는 호칭을 사용할 뿐, 헬로 바비를 구현하는 테크놀로지는 엄마와 아빠의 휴대전화 속 시리, 구글 나우, 코타나 등과 다를 바가 없는 것이다.


2015.09.25

칼럼 | 성큼 도래한 유비쿼터스 AI 세상··· 마음의 준비를 'Her'하라

Mike Elgan | Computerworld

인공 지능이라는 낯선 존재를 대하는 속 편한 방법 중 하나는, 이를 그저 응접실의 장식품이나 신기한 장난감, 또는 괴상한 기계로 치부해버리는 것이다.

지난 주 마이크로소프트의 CEO 사티야 나델라는 자사의 가상 비서 코타나(Cortana)가 저지른 실수로 망신을 겪었다. 세일즈포스 닷컴의 드림포스(Dreamforce) 행사장을 찾은 나델라는 비즈니스 툴로서 코타나의 역량을 시연하는 자리를 가졌다.

나델라는 데모 버전의 코타나에게 “지금 가장 리스크가 큰 기회가 뭐지?”(Show me my most at-risk opportunities?)라는 질문을 던졌다. 그러나 코타나는 이 질문을 “지금 우유를 살만한 곳이 있을까?”(Show me to buy milk at this opportunity?)라고 인식해 나델라를 비롯한 현장의 모두를 당황케 했다.

하지만 이 에피소드는 코타나의 치명적인 결함이라기보단, 인터페이스의 오류로 보는 것이 옳을 것이다. 그리고 이번에 나델라가 시연한 코타나는 어디까지나 데모 버전이라는 점 역시 기억할 필요가 있다. (전문가로서 전하는 팁: 테크놀로지 이벤트 현장에서 조용히 무대에만 집중하는 사람은 찾아보기 힘들다. 음성 인식 시스템을 시연하고자 한다면 마이크는 필수다.)

미디어 대부분은 이 사건을 ‘사티야의 망신' 정도로 다뤘다. 그러나 사실 좀더 주목할 필요가 있는 것은 사티야가 코타나에게 던진 질문이다. 가상 비서 이면에 자리한 기술이 이제 기업의 리스크를 분석할 수 있는 수준까지, 다시 말해 우리가 상상하던 미래를 현실로 만들만한 수준까지 발전했다는 사실이다.

테크놀로지는 앞으로 우리의 삶을 때론 놀랍게, 또 때론 두렵게 바꿔나갈 것이다. 물론 대부분의 변화는 우리를 경탄하게 할 방향으로 이뤄질 것이다.

가상 비서의 진화는 계속될 것이고 우리는 그들과 대화를 나누며 실제 인간과 소통하는 것과 다르지 않은 감정을 느낄 것이다. 하나의 가상 비서를 구현하기 위해선 수많은 개별 기술들이 기능한다. ‘좋은’ 가상 비서를 판단하는 기준은 이 서로 다른 테크놀로지들이 얼마나 유기적으로 얽혀 하나의 경험을 구현하는지의 여부다. 여기 가상 비서를 구성하는 테크놀로지들을 살펴보자.

- 음성 인식: 사용자의 발화와 구어적 표현, 액센트를 인식하며 배경 음성과 비-발화적 음향을 구별해 배제할 수 있는 기술이다. 핵심은 사용자의 발화가 이어지는 순간에 그 정보를 실시간으로 처리할 수 있는 기술력에 있다.

- 파일 압축 및 전송: 음성 파일을 압축해 프로세싱을 담당하는 데이터센터로 전송하는 속도를 의미한다.

- 인공 지능(A.I.): 수집한 정보를 소프트웨어가 ‘이해’하고 거기에 어떤 정보를 제공해야 하는지를 결정하는 역량이다.

- 데이터 소스: 반응 통지를 위해 지식 기반이나 계산 엔진 등의 데이터에 접근하는 기능을 의미한다.

- 사용자 맥락: 이메일, 캘린더, 연락처, 지도, 검색 기록 등 현재 실행 중인 기능들에서 정보를 추출해내는 기능이다.

- 대화 엔진: 답변을 다변화하고 구어, 농담, 맥락 등을 응용할 수 있는 기능이다.

- 대행: 일정 추가나 메시지 전송, 상품 구매, 앱 실행 및 앱 내 기능 실행 등의 동작을 사용자 대신 수행할 수 있는 기능을 의미한다.

- 예측: 사용자의 지시 없이도 특정 활동을 진행하는 역량이다.

이 요소들 각각은 상호 독립적으로 동작하며, 그 기능을 위해 다양한 방법론과 테크놀로지의 지원을 받는다. 그리고 무엇보다 중요한 사실은, 이들 각각이 급격한 혁신을 이룩하며 각자의 시장을 형성해가고 있다는 점이다. 이제 기업들은 시장에서 이 기능들 가운데 자신들의 인터페이스나 상품에 필요한 요소들을 구매해 적용할 수도 있다.

예를 들어 애플의 가상 비서 시리가 음성 인식, 프로세싱, 인공 지능, 데이터 수용 네 영역에서 각각 25%씩의 기능 향상에 성공한다 상상해보자. 이는 향후 수 개월 이내에 달성 가능한 상상이다. 이 정도의 발전만으로도 시리는 현재와는 비교할 수 없을 정도의 기능성을 구현할 것이다.

과거의 가상 비서는 실용성과는 거리가 먼 장난감이었을지 모르지만, 불과 1~2년 만에 이는 컴퓨팅 인터페이스의 주축으로 자리를 잡아가고 있다.

아마존 파이어 TV나 애플의 신형 애플 TV처럼, 가상 비서를 제 1 인터페이스로 활용하는 사례도 하나 둘 나타나고 있다.

하운드(Hound)와 같은 강력한 신형 앱의 등장 또한 가상 비서 테크놀로지의 활성화에 기여하는 요인이다. 페이스북 메신저의 M 기능 역시 앱에 가상 비서 테크놀로지를 더한 좋은 사례다. 아마존 에코(Echo) 등의 가상 비서 설비 시장도 큰 폭의 성장이 예상되는 영역이다.

이러한 사례들은 단지 시작일 뿐이다. 머지 않은 미래 우리는 더욱 강력한 가상 비서들이 각종 기기와 설비의 주 인터페이스로 역할 하는 모습을 볼 수 있을 것이다.

A.I.는 인형 분야에서도 활약할 전망이다.

A.I. 크리스마스
마텔(Mattel)사는 최근 보도자료를 통해 새로운 버전의 바비 인형이 2개월 이내에 시장에 선을 보일 것이라 소개했다. 차세대 바비 인형은 정교한 인공 지능 엔진을 통해 아이들과 대화를 나누는 게 가능하다.



74.99 달러의 가격에 출시 예정인 헬로 바비(Hello Barbie)는 양 다리에 배터리가 내장되어 있으며, 등 아래쪽에 위치한 USB 포트를 통해 충전이 가능하다. 헬로 바비는 목걸이를 마이크로 이용하며 사용자는 벨트 버클에 위치한 버튼을 눌러 마이크를 활성화할 수 있다. 헬로 바비의 뇌 역할을 하는 소형 컴퓨터와 와이파이 안테나는 작은 머리가 아닌 몸통부분에 위치하게 된다.

사용자인 아이가 헬로 바비에게 말을 걸면, 바비는 해당 음성 파일을 녹취, 압축해 외부 서버(토이톡(ToyTalk)의 자체 데이터 센터)로 전송해 분석한다. 애플의 시리와 같은 형태의 운영 방식이다. 분석이 완료되면 그에 대한 적절한 응답을 구성해 다시 바비에게 전달되고 재생이 이뤄진다. 시리와 마찬가지로 바비가 하는 모든 말은 마텔에 의해 작성된다.

헬로 바비 프로젝트 공개 이후 대중의 반응은 뜨거웠다. 걱정 많은 언론들은 아이의 음성이 와이파이 네트워크를 통해 전달된다는 이 계획에 ‘소름 끼친다’, ‘도청의 위험이 있다’라는 식의 문제를 제기했다. 아동들의 프라이버시를 고려치 않는다는 것이 비판의 핵심이었다.

하지만 사실 이러한 인터페이스는 이미 아이들의 주변에 자리 잡고 있다. 인공 지능이라거나 가상 비서가 아닌 ‘친구’라는 호칭을 사용할 뿐, 헬로 바비를 구현하는 테크놀로지는 엄마와 아빠의 휴대전화 속 시리, 구글 나우, 코타나 등과 다를 바가 없는 것이다.


X