2016.11.30

칼럼 | 구글 번역이 달라졌어요...

정철환 | CIO KR
인류가 하늘에 닿기 위해 바벨탑을 높게 쌓다가 신의 노여움을 받아 세상의 말이 제각각 갈라져 서로 의사소통이 어렵게 되었다는 성경의 이야기처럼 외국어로 인해 여행, 학습, 업무 수행에서 어려움을 겪어보지 않은 사람은 아마 없을 것이다. 오랜 기간 외국어를 공부하지만 쉽게 외국인과 대화를 나누거나 글을 번역하는 것은 여전히 모두에게 쉬운 일은 아니다. 많은 SF소설이나 영화에서 컴퓨터가 자동으로 외국어를 번역해주는 모습을 그려낸  이유일 것이다.

이런 외국어 번역은 인공지능의 여러 분야 중 대표적인 분야다. 그래서 컴퓨터가 등장한 후 오랜 기간 연구됐고 다양한 방법으로 자동 번역을 꿈꾸며 노력해왔다. 구글에서도 구글 번역을 통해 세계 각국의 언어를 번역할 수 있는 기능을 제공한 지도 10년이 지났다.

하지만 세계 각국의 언어가 서로 유사한 언어도 있고 크게 다른 언어도 있는 관계로 그 번역 결과가 그리 신통치 않은 경우가 많았다. 한글을 예로 들면 문법적으로 유사한 일본어와는 제법 그럴듯한 번역을 제공하지만 가장 많이 쓰이는 영어와의 번역 결과는 그리 신통치 않았다. 사실 신통치 않은 정도가 아니라 거의 의미가 없는 수준인 경우가 많았다. 아마도 두 언어의 근본이 완전히 다르기 때문일 것이다.

그런데 얼마 전 (2016년 11월 15일) 구글이 예전의 번역 방식은 룰 기반 방식이 아닌 인공지능 학습 방식을 이용한 새로운 번역을 내놓았다. 그리고 필자가 한글과 영어를 상호 번역해 보니 그 결과는 거의 경악에 가까운 수준이었다. 마치 사람이 번역한 듯 매끄러운 번역 결과는 이제 인류의 가장 큰 장벽 중 하나인 언어의 장벽이 머지않은 장래에 허물어질 수 있다는 가능성을 보았다. 그리고 구글 번역이 이루어 낼 결과의 의미를 생각해보니 감격스럽다는 생각이 들었다. 과연 구글 번역은 우리에게 어떤 기회를 제공하는가?

우선 다양한 글의 번역을 실시간으로 자유롭게 할 수 있게 되면서 외국 도서의 번역서를 기다리지 않아도 바로 읽을 수 있게 될 것이다. 또한 외국의 인터넷 사이트의 내용도 쉽게 읽을 수 있게 될 것이다. 인터넷이 정보의 바다라지만 사실 외국어 특히 영어를 할 줄 모르는 사람들에겐 아주 좁은 바다였다. 세계 각국의 여러 서적들이 모두 번역되는 것은 아니기에 지식의 습득에도 제약이 되었다. 이에 따라 인류의 지적 교류는 더욱 활발해질 것이다.

두 번째로 대한민국의 많은 서적들이 쉽게 외국으로 진출할 수 있다. 물론 문학성을 가진 책의 경우에는 쉽지 않겠지만 기술분야의 책은 가능할 것이다. 아마존에는 오래전부터 개인이 자신의 책을 온라인으로 출판할 수 있는 킨들 퍼블리시 기능이 있다. 정해진 양식에 맞추어 책을 작성한 뒤 온라인으로 올리기만 하면 전세계를 대상으로 자신의 책을 팔 수 있다. 그리고 판매액의 70%를 저자에게 제공한다. 오프라인 출판과는 비교가 안 되는 수준이다. 그리고 전세계를 대상으로 팔 수 있다. 그런데 문제는 영어로 써야 하기에 쉽게 도전하기 어려운 문제가 있었으나 구글 번역이 많은 저자들에게 아마존 출판의 기회를 제공할 것이다.

그리고 구글 번역은 스마트폰에서도 이용할 수 있으며 실시간으로 음성을 인식하여 원하는 외국어로 번역한 뒤 다시 음성으로 들려주는 기능도 제공한다. 따라서 개선된 구글 번역을 바탕으로 외국여행이나 업무 출장 시 비록 그 나라의 언어를 몰라도 많은 불편 없이 다닐 수 있게 되어 여행의 자유를 좀 더 크게 해 줄 것이다. 또한 당연히 외국과 관련된 업무를 수행해야 하는 사람들에게 대단히 편리한 번역 서비스를 제공하게 될 것이다. 여기서 더 발전한다면 외국인과 전화 통화 시 실시간으로 양방향 번역도 불가능하지 않다.

더구나 새로운 구글 번역은 다양한 번역 결과와 사용자의 도움을 통해 스스로 학습하고 발전해 나가는 구조로 되어 있다. 따라서 시간이 지남에 따라 번역의 자연스러움과 질이 향상될 것이다. 그래서 머지않은 미래에 진정으로 언어의 장벽으로부터 자유로워지는 날이 오게 될 것으로 생각한다.


그런데 구글은 왜 많은 시간과 노력을 쏟아부은 번역 서비스를 무료로 제공하고 있을까? 단지 구글이 전 인류의 보다 나은 생활을 위해 그러는 것일까? 페이스북이 무료로 전세계 사용자들에게 소셜 서비스를 제공하지만 기업가치는 어마어마하다. 그 기업가치의 근본은 가입자들의 일거수일투족을 파악할 수 있고 이를 바탕으로 새로운 사업모델을 개발할 수 있다는 점에서 기인한다.

아마도 구글 번역이 좀 더 향상되고, 그래서 전세계 사람들이 다방면에서 사용하게 된다면 페이스북에 버금가는, 아니 현재 언어의 장벽에 갇혀있는 페이스북을 능가하는 소셜 인사이트를 얻을 수 있게 되지 않을까? 일상의 대화, 오가는 글을 파악할 수 있게 된다는 건 가치를 환산하기 어려운 능력이다. 물론 향상된 번역 기능 자체를 응용할 분야들도 무궁무진하겠지만 말이다. 영화 <스타트렉>에서의 다양한 기술들 중에 하나가 현실화 될 날이 머지않은 것 같다.

*정철환 팀장은 삼성SDS, 한양대학교 겸임교수를 거쳐 현재 동부제철 IT기획팀장이다. 저서로는 ‘SI 프로젝트 전문가로 가는 길’이 있으며 삼성SDS 사보에 1년 동안 원고를 쓴 경력이 있다. 한국IDG가 주관하는 CIO 어워드 2012에서 올해의 CIO로 선정됐다. ciokr@idg.co.kr
 



2016.11.30

칼럼 | 구글 번역이 달라졌어요...

정철환 | CIO KR
인류가 하늘에 닿기 위해 바벨탑을 높게 쌓다가 신의 노여움을 받아 세상의 말이 제각각 갈라져 서로 의사소통이 어렵게 되었다는 성경의 이야기처럼 외국어로 인해 여행, 학습, 업무 수행에서 어려움을 겪어보지 않은 사람은 아마 없을 것이다. 오랜 기간 외국어를 공부하지만 쉽게 외국인과 대화를 나누거나 글을 번역하는 것은 여전히 모두에게 쉬운 일은 아니다. 많은 SF소설이나 영화에서 컴퓨터가 자동으로 외국어를 번역해주는 모습을 그려낸  이유일 것이다.

이런 외국어 번역은 인공지능의 여러 분야 중 대표적인 분야다. 그래서 컴퓨터가 등장한 후 오랜 기간 연구됐고 다양한 방법으로 자동 번역을 꿈꾸며 노력해왔다. 구글에서도 구글 번역을 통해 세계 각국의 언어를 번역할 수 있는 기능을 제공한 지도 10년이 지났다.

하지만 세계 각국의 언어가 서로 유사한 언어도 있고 크게 다른 언어도 있는 관계로 그 번역 결과가 그리 신통치 않은 경우가 많았다. 한글을 예로 들면 문법적으로 유사한 일본어와는 제법 그럴듯한 번역을 제공하지만 가장 많이 쓰이는 영어와의 번역 결과는 그리 신통치 않았다. 사실 신통치 않은 정도가 아니라 거의 의미가 없는 수준인 경우가 많았다. 아마도 두 언어의 근본이 완전히 다르기 때문일 것이다.

그런데 얼마 전 (2016년 11월 15일) 구글이 예전의 번역 방식은 룰 기반 방식이 아닌 인공지능 학습 방식을 이용한 새로운 번역을 내놓았다. 그리고 필자가 한글과 영어를 상호 번역해 보니 그 결과는 거의 경악에 가까운 수준이었다. 마치 사람이 번역한 듯 매끄러운 번역 결과는 이제 인류의 가장 큰 장벽 중 하나인 언어의 장벽이 머지않은 장래에 허물어질 수 있다는 가능성을 보았다. 그리고 구글 번역이 이루어 낼 결과의 의미를 생각해보니 감격스럽다는 생각이 들었다. 과연 구글 번역은 우리에게 어떤 기회를 제공하는가?

우선 다양한 글의 번역을 실시간으로 자유롭게 할 수 있게 되면서 외국 도서의 번역서를 기다리지 않아도 바로 읽을 수 있게 될 것이다. 또한 외국의 인터넷 사이트의 내용도 쉽게 읽을 수 있게 될 것이다. 인터넷이 정보의 바다라지만 사실 외국어 특히 영어를 할 줄 모르는 사람들에겐 아주 좁은 바다였다. 세계 각국의 여러 서적들이 모두 번역되는 것은 아니기에 지식의 습득에도 제약이 되었다. 이에 따라 인류의 지적 교류는 더욱 활발해질 것이다.

두 번째로 대한민국의 많은 서적들이 쉽게 외국으로 진출할 수 있다. 물론 문학성을 가진 책의 경우에는 쉽지 않겠지만 기술분야의 책은 가능할 것이다. 아마존에는 오래전부터 개인이 자신의 책을 온라인으로 출판할 수 있는 킨들 퍼블리시 기능이 있다. 정해진 양식에 맞추어 책을 작성한 뒤 온라인으로 올리기만 하면 전세계를 대상으로 자신의 책을 팔 수 있다. 그리고 판매액의 70%를 저자에게 제공한다. 오프라인 출판과는 비교가 안 되는 수준이다. 그리고 전세계를 대상으로 팔 수 있다. 그런데 문제는 영어로 써야 하기에 쉽게 도전하기 어려운 문제가 있었으나 구글 번역이 많은 저자들에게 아마존 출판의 기회를 제공할 것이다.

그리고 구글 번역은 스마트폰에서도 이용할 수 있으며 실시간으로 음성을 인식하여 원하는 외국어로 번역한 뒤 다시 음성으로 들려주는 기능도 제공한다. 따라서 개선된 구글 번역을 바탕으로 외국여행이나 업무 출장 시 비록 그 나라의 언어를 몰라도 많은 불편 없이 다닐 수 있게 되어 여행의 자유를 좀 더 크게 해 줄 것이다. 또한 당연히 외국과 관련된 업무를 수행해야 하는 사람들에게 대단히 편리한 번역 서비스를 제공하게 될 것이다. 여기서 더 발전한다면 외국인과 전화 통화 시 실시간으로 양방향 번역도 불가능하지 않다.

더구나 새로운 구글 번역은 다양한 번역 결과와 사용자의 도움을 통해 스스로 학습하고 발전해 나가는 구조로 되어 있다. 따라서 시간이 지남에 따라 번역의 자연스러움과 질이 향상될 것이다. 그래서 머지않은 미래에 진정으로 언어의 장벽으로부터 자유로워지는 날이 오게 될 것으로 생각한다.


그런데 구글은 왜 많은 시간과 노력을 쏟아부은 번역 서비스를 무료로 제공하고 있을까? 단지 구글이 전 인류의 보다 나은 생활을 위해 그러는 것일까? 페이스북이 무료로 전세계 사용자들에게 소셜 서비스를 제공하지만 기업가치는 어마어마하다. 그 기업가치의 근본은 가입자들의 일거수일투족을 파악할 수 있고 이를 바탕으로 새로운 사업모델을 개발할 수 있다는 점에서 기인한다.

아마도 구글 번역이 좀 더 향상되고, 그래서 전세계 사람들이 다방면에서 사용하게 된다면 페이스북에 버금가는, 아니 현재 언어의 장벽에 갇혀있는 페이스북을 능가하는 소셜 인사이트를 얻을 수 있게 되지 않을까? 일상의 대화, 오가는 글을 파악할 수 있게 된다는 건 가치를 환산하기 어려운 능력이다. 물론 향상된 번역 기능 자체를 응용할 분야들도 무궁무진하겠지만 말이다. 영화 <스타트렉>에서의 다양한 기술들 중에 하나가 현실화 될 날이 머지않은 것 같다.

*정철환 팀장은 삼성SDS, 한양대학교 겸임교수를 거쳐 현재 동부제철 IT기획팀장이다. 저서로는 ‘SI 프로젝트 전문가로 가는 길’이 있으며 삼성SDS 사보에 1년 동안 원고를 쓴 경력이 있다. 한국IDG가 주관하는 CIO 어워드 2012에서 올해의 CIO로 선정됐다. ciokr@idg.co.kr
 

X