2015.08.11

컴퓨터에게 유머를 가르치기··· MS의 연구 프로젝트 실효성은?

Jared Newman | PCWorld
언젠가 터미네이터가 인류를 종말시키려 할 때, 로봇이 인류에 대해 농담을 던지더라도 놀라지 않을 일이다.

마이크로소프트는 회사의 연구 프로젝트를 통해 컴퓨터에게 '희극의 의미'를 가르치려 시도했다. 뉴요커의 카툰 콘텐스트를 재료로 삼아 컴퓨터 알고리듬이 독자의 반응을 수천 건을 토대로 가장 재미있는 캡션을 골라내도록 훈련시킨 것이다.

블룸버그 보도에 따르면 이 연구는 실제로 매주 5,000여 건의 캡션 콘테스트를 확인해야 하는 뉴요커의 편집자에게 실제적인 도움이 될 수 있었다. 알고리즘의 선택이 편집자의 선택값과 상당 부분 일치했던 것이다. 블룸버그 기사에는 "평균적으로... 편집자의 선택은 AI의 선택 중 55.8%에서도 나타났다"라고 기술돼 있다.

마이크로소프트가 이번 연구를 진행하는 이유는 있다. 컴퓨터가 유머를 인지하는 능력은 스카이프 번역기 등에게 중요한 요소이기 때문이다. 실제로 스카이프 번역기는 머신 러닝을 이용해 번역 능력을 키워가고 있는데, 인공 지능이 유머를 이해한다면 번역의 품질이 한층 올라갈 수 있게 된다. 이는 마이크로소프트의 가상 비서 코타나에게도 적용되는 이야기다.

마이크로소프트 연구진은 개별 카툰의 어떤 시각적 요소가 재미있는지를 물어보고 이에 부응하는 캡션을 분석함으로써, 각 캡션의 핵심 단어나 문장을 규명할 수 있는 알고리즘을 도출해냈다.

여기에서 유머 점수는 다양한 요인에 기초한다. 농담의 길이(단어가 적을 수록 재미있는 경향), 핵심 알맹이의 위치(뒤에 있을 수록 우수), 이미지 콘텐츠의 유사성 등이 그것이다.

그러나 이 알고리즘이 꽤 효과적임에도 불구하고 몇몇 맹점도 있었다는 설명이다. 예를 들어 고유 명사가 엉뚱하게 낮은 점수 요인이 되곤 했던 것으로 전해졌다. 이 밖에 이 알고리즘은 특정 표현을 이해하지 못하거나 특정 단어를 이용할 때의 의미를 이해하지 못했다. 신을 의미하기 위해 'Him'을 이용하는 등의 상황이 한 예다.

보도에 따르면 뉴요커는 이러한 이유로 마이크로소프트의 알고리즘을 현장에 배치한다는 결정을 내리지는 않았다. 편집자 밥 맨코프는 아직 충분히 정확한 시스템이 아니라며 이 기계가 인간의 유머를 진정으로 대체할 수 있을지 의문스럽다고 말했다.

또 코미디가 지속적으로 개발되고 변화하는 무엇이라는 점에서 인류가 개발한 로봇 또는 인공 지능이 그 변화지속성을 유지할 수 있을지 현재로서는 미지수다. ciokr@idg.co.kr 



2015.08.11

컴퓨터에게 유머를 가르치기··· MS의 연구 프로젝트 실효성은?

Jared Newman | PCWorld
언젠가 터미네이터가 인류를 종말시키려 할 때, 로봇이 인류에 대해 농담을 던지더라도 놀라지 않을 일이다.

마이크로소프트는 회사의 연구 프로젝트를 통해 컴퓨터에게 '희극의 의미'를 가르치려 시도했다. 뉴요커의 카툰 콘텐스트를 재료로 삼아 컴퓨터 알고리듬이 독자의 반응을 수천 건을 토대로 가장 재미있는 캡션을 골라내도록 훈련시킨 것이다.

블룸버그 보도에 따르면 이 연구는 실제로 매주 5,000여 건의 캡션 콘테스트를 확인해야 하는 뉴요커의 편집자에게 실제적인 도움이 될 수 있었다. 알고리즘의 선택이 편집자의 선택값과 상당 부분 일치했던 것이다. 블룸버그 기사에는 "평균적으로... 편집자의 선택은 AI의 선택 중 55.8%에서도 나타났다"라고 기술돼 있다.

마이크로소프트가 이번 연구를 진행하는 이유는 있다. 컴퓨터가 유머를 인지하는 능력은 스카이프 번역기 등에게 중요한 요소이기 때문이다. 실제로 스카이프 번역기는 머신 러닝을 이용해 번역 능력을 키워가고 있는데, 인공 지능이 유머를 이해한다면 번역의 품질이 한층 올라갈 수 있게 된다. 이는 마이크로소프트의 가상 비서 코타나에게도 적용되는 이야기다.

마이크로소프트 연구진은 개별 카툰의 어떤 시각적 요소가 재미있는지를 물어보고 이에 부응하는 캡션을 분석함으로써, 각 캡션의 핵심 단어나 문장을 규명할 수 있는 알고리즘을 도출해냈다.

여기에서 유머 점수는 다양한 요인에 기초한다. 농담의 길이(단어가 적을 수록 재미있는 경향), 핵심 알맹이의 위치(뒤에 있을 수록 우수), 이미지 콘텐츠의 유사성 등이 그것이다.

그러나 이 알고리즘이 꽤 효과적임에도 불구하고 몇몇 맹점도 있었다는 설명이다. 예를 들어 고유 명사가 엉뚱하게 낮은 점수 요인이 되곤 했던 것으로 전해졌다. 이 밖에 이 알고리즘은 특정 표현을 이해하지 못하거나 특정 단어를 이용할 때의 의미를 이해하지 못했다. 신을 의미하기 위해 'Him'을 이용하는 등의 상황이 한 예다.

보도에 따르면 뉴요커는 이러한 이유로 마이크로소프트의 알고리즘을 현장에 배치한다는 결정을 내리지는 않았다. 편집자 밥 맨코프는 아직 충분히 정확한 시스템이 아니라며 이 기계가 인간의 유머를 진정으로 대체할 수 있을지 의문스럽다고 말했다.

또 코미디가 지속적으로 개발되고 변화하는 무엇이라는 점에서 인류가 개발한 로봇 또는 인공 지능이 그 변화지속성을 유지할 수 있을지 현재로서는 미지수다. ciokr@idg.co.kr 

X