2011.10.26

아이폰 4S의 디지털 비서 시리가 특별한 이유

David Daw | PCWorld
아이폰 4S의 가상 개인 비서인 시리에게 “왜 그렇게 유능한가”라고 물으면 시리는 겸손하게 “저는 저일 뿐입니다(I am what I am)”라고 대답한다.
 
그러나 업계 전문가들은 시리의 가능성을 그 이상으로 평가한다. 시리는 단순한 음성 인식을 넘어, 강력한 인공 지능과 통계 분석을 적용해 가끔은 산만하기도 한 질문자의 문장에 담긴 뜻을 파악한다. 여기에 의표를 찌르는 재치까지 갖춘 시리는 폰과 태블릿, PC에서도 유사한 기술을 크게 유행시킬 수 있는 강력한 잠재력을 지녔다.
 
시리가 지금 주목 받는 것은 그 기반이 되는 복합적인 기술들이 마침내 소비자들이 사용할 수 있는 수준에 이르렀기 때문이다. 시리에게 가까운 음식점을 찾아달라고 하면 시리는 단순히 음성 인식을 통해 요청을 처리하는 것이 아니라 클라우드에 질문을 보낸다. 클라우드는 강력한 인공 지능 알고리즘으로 문구를 분석하고, 사용자가 원하는 것이 정확히 무엇인지 파악한 다음 폰에 대답을 보낸다. 그러면 시리가 그 대답을 받아 예를 들어 근처의 멕시코 음식점을 검색한다. 3년 전까지만 해도 이런 클라우드 기반 분석은 불가능했다. 이제부터 클라우드 기술로 할 수 있는 일들이 폭발적으로 쏟아져 나오기 시작할 것이다.
 
단순한 음성 인식을 넘어서다
시리와 같은 서비스는 사용자의 발음이나 단어 선택이 적절하지 못한 경우에도 통계 모델을 사용해 진의를 파악하는 “자연어 처리” 앱이다. 자연어 프로그램은 예를 들어 소리만 들어서는 “나는 큰집(큰아버지가 사는 집)이 좋다”지만 사실 이 문장이 “나는 큰 집(커다란 집)이 좋다”라는 의미일 수도 있음을 인지한다.
 
이러한 기술은 몇 년 전에 등장했다. 은행의 로봇 지불 시스템을 음성으로 조작한 적이 있다면 바로 자연어 처리를 사용한 것이다. (다만 과거에는 언어 처리 능력이 상당히 뒤떨어진 경우가 많았다.)
 
안드로이드 폰도 몇 년 전부터 클라우드 기반 언어 처리를 사용해왔다. 그러나 예를 들어 구글의 보이스 액션(Voice Actions) 앱은 통신을 하려면 "listen to..." 또는 "note to self..."와 같은 제한적인 명령만 사용해야 한다.
 
시리는 사용자에 대한 지식을 계속 누적하고, 여기에 인공 지능을 결합해서 사용자의 말뿐만 아니라 그 안에 담긴 의미도 이해한다. 따라서 여러 가지 방법으로 시리에게 질문을 던질 수 있다. 시리는 아이폰 4S에 통합되어 있으므로 사용자가 어디에 있는지, 누구와 가장 자주 연락하는지도 안다. 이러한 배경 정보는 “가까운 택시 정류장을 찾아줘” 또는 “엄마한테 전화해”라는 말을 시리가 이해하는 데 도움이 된다. 즉, “홍길동에게 전화해”라는 명령 외에, “가장 친한 친구에게 전화해” 또는 “길동이랑 얘기하고 싶어”라는 말에도 똑같이 반응한다.
 
시리의 차별성
사용자들은 사람에게 말하듯 시리에게 말하고 싶어한다. 시리는 단순히 사용자가 말하는 것을 이해하는 것이 아니라 자기만의 성격을 갖고 있기 때문이다.
 
음성 인식 프로그램에서 가끔 불편한 부분은 사람들의 말을 고집스럽게 잘못 해석하는 현상이다. 온갖 첨단 기술이 동원된 시리도 여전히 실수를 한다. 그러나 시리에서 음성 인식은 대화로 이루어지며, 사람들은 대화 중 의견 전달이 제대로 되지 않는 문제에 대처하는 데 이미 익숙하다. 시리의 인터페이스는 인공 지능이 음성 인식에 실패한 상황에서도 매끄럽게 대처할 수 있는 길을 열어준다.
 



2011.10.26

아이폰 4S의 디지털 비서 시리가 특별한 이유

David Daw | PCWorld
아이폰 4S의 가상 개인 비서인 시리에게 “왜 그렇게 유능한가”라고 물으면 시리는 겸손하게 “저는 저일 뿐입니다(I am what I am)”라고 대답한다.
 
그러나 업계 전문가들은 시리의 가능성을 그 이상으로 평가한다. 시리는 단순한 음성 인식을 넘어, 강력한 인공 지능과 통계 분석을 적용해 가끔은 산만하기도 한 질문자의 문장에 담긴 뜻을 파악한다. 여기에 의표를 찌르는 재치까지 갖춘 시리는 폰과 태블릿, PC에서도 유사한 기술을 크게 유행시킬 수 있는 강력한 잠재력을 지녔다.
 
시리가 지금 주목 받는 것은 그 기반이 되는 복합적인 기술들이 마침내 소비자들이 사용할 수 있는 수준에 이르렀기 때문이다. 시리에게 가까운 음식점을 찾아달라고 하면 시리는 단순히 음성 인식을 통해 요청을 처리하는 것이 아니라 클라우드에 질문을 보낸다. 클라우드는 강력한 인공 지능 알고리즘으로 문구를 분석하고, 사용자가 원하는 것이 정확히 무엇인지 파악한 다음 폰에 대답을 보낸다. 그러면 시리가 그 대답을 받아 예를 들어 근처의 멕시코 음식점을 검색한다. 3년 전까지만 해도 이런 클라우드 기반 분석은 불가능했다. 이제부터 클라우드 기술로 할 수 있는 일들이 폭발적으로 쏟아져 나오기 시작할 것이다.
 
단순한 음성 인식을 넘어서다
시리와 같은 서비스는 사용자의 발음이나 단어 선택이 적절하지 못한 경우에도 통계 모델을 사용해 진의를 파악하는 “자연어 처리” 앱이다. 자연어 프로그램은 예를 들어 소리만 들어서는 “나는 큰집(큰아버지가 사는 집)이 좋다”지만 사실 이 문장이 “나는 큰 집(커다란 집)이 좋다”라는 의미일 수도 있음을 인지한다.
 
이러한 기술은 몇 년 전에 등장했다. 은행의 로봇 지불 시스템을 음성으로 조작한 적이 있다면 바로 자연어 처리를 사용한 것이다. (다만 과거에는 언어 처리 능력이 상당히 뒤떨어진 경우가 많았다.)
 
안드로이드 폰도 몇 년 전부터 클라우드 기반 언어 처리를 사용해왔다. 그러나 예를 들어 구글의 보이스 액션(Voice Actions) 앱은 통신을 하려면 "listen to..." 또는 "note to self..."와 같은 제한적인 명령만 사용해야 한다.
 
시리는 사용자에 대한 지식을 계속 누적하고, 여기에 인공 지능을 결합해서 사용자의 말뿐만 아니라 그 안에 담긴 의미도 이해한다. 따라서 여러 가지 방법으로 시리에게 질문을 던질 수 있다. 시리는 아이폰 4S에 통합되어 있으므로 사용자가 어디에 있는지, 누구와 가장 자주 연락하는지도 안다. 이러한 배경 정보는 “가까운 택시 정류장을 찾아줘” 또는 “엄마한테 전화해”라는 말을 시리가 이해하는 데 도움이 된다. 즉, “홍길동에게 전화해”라는 명령 외에, “가장 친한 친구에게 전화해” 또는 “길동이랑 얘기하고 싶어”라는 말에도 똑같이 반응한다.
 
시리의 차별성
사용자들은 사람에게 말하듯 시리에게 말하고 싶어한다. 시리는 단순히 사용자가 말하는 것을 이해하는 것이 아니라 자기만의 성격을 갖고 있기 때문이다.
 
음성 인식 프로그램에서 가끔 불편한 부분은 사람들의 말을 고집스럽게 잘못 해석하는 현상이다. 온갖 첨단 기술이 동원된 시리도 여전히 실수를 한다. 그러나 시리에서 음성 인식은 대화로 이루어지며, 사람들은 대화 중 의견 전달이 제대로 되지 않는 문제에 대처하는 데 이미 익숙하다. 시리의 인터페이스는 인공 지능이 음성 인식에 실패한 상황에서도 매끄럽게 대처할 수 있는 길을 열어준다.
 

X