2021.07.15

최형광 칼럼 | 인공지능과 튜링테스트의 본질?

최형광 | CIO KR
1737년 보캉송은 인간의 연주와 같은 방식으로 직접공기를 불어넣고 손가락으로 연주하는 ‘플루트 연주자’ 자동인형을 제작했다. 2011년 제퍼디(Jeopardy!) 퀴즈게임에서 IBM 왓슨(Watson)은 역대 최대 상금 수상자인 브래드 러터(Brad Rutter)와 최장기 우승자인 켄 제닝스(Ken Jennings)와 대결하여 상금 100만 달러 획득했다. 2016년 구글 딥마인드의 알파고는 서울 포시즌 호텔에서 이세돌 9단과의 대국에서 4승 1패를 기록하고 은퇴했다.

인간을 닮은 로봇
안드로이드(인간을 닮은 로봇, andro-인간 eidos-형상의 합성어)에 대한 도전의 역사는 길다. 자크 드 보캉송이 1737년에 만든 ‘플루트 연주자’는 생체역학 기반의 자동화 구현으로 12곡을 연주할 수 있었다. 플루트 연주자는 1738년 프랑스 아카데미에서 시연됐다. 연주는 15개의 레버에 사슬과 끈을 사용하여 공기를 불어넣어 출력을 만들고, 입술의 움직임, 혀, 손가락의 움직임을 제어하여 구동됐다. 보캉송은 1745년에 세계 최초의 자동 직기를 만들기도 했다.

제퍼디에서 왓슨은 질문에 답변을 해서 이기는 게 아니라 문제의 답에 확신이 있을 때 먼저 버튼을 누르고 정확한 답변을 해야 한다. 틀릴 경우에는 감점이 발생하기에 모르면 응답하면 안 된다. 또한 상금을 베팅하면서 이겨야 한다. 경쟁자는 제퍼디에서 74번 우승한 켄 제닝스, 최고 상금을 수상한 브래드 러터였고 질문은 문맥을 이해할 수 있어야 답변이 가능했다. [그림1]은 플루트 연주자 설계도와 왓슨 DeepQA 아키텍처를 보여주고 있다.


[그림1] 플루트 연주자 설계도와 왓슨 DeepQA 아키텍처. 플루트 연주자는 하드웨어 구현이며 왓슨은 고급 자연어 처리, 의미 분석, 정보 검색, 자동 추론 및 기계 학습을 사용하는 소프트웨어 구현이다.

왓슨은 질문에 대한 복잡한 연결시스템, 융복합된 상호 작용을 위해 AdaptWatson 방법론으로 정보 검색(IR), 자연어 처리(NLP) 및 추론(KRR)등의 접목을 시도했다. 제퍼디 우승자 50여명과 가상의 시뮬레이션 테스트를 거친 후 본 게임에서 우승을 거뒀다. 

그러나, “2차 세계대전 영웅의 이름을 딴 공항과 2차 세계대전 격전지의 이름을 딴 제2의 공항을 가진 곳은 어디인가? 힌트는 미국의 도시” 라는 질문에 두 사람은 정확히 시카고라고 얘기하나 왓슨은 토론토라는 예상외의 답변을 하기도 했다. 시카고에는 미해군 전투기 조종사 ‘에드워드 헨리 오헤어’의 이름을 딴 오헤어 공항과 ‘미드웨이 전투’를 기리기 위한 미드웨이 공항이 있다.

바둑은 인공지능이 인간을 뛰어넘기 가장 어려운 분야로 알려졌다. 체스나 다른 게임과 달리 경우의 수가 너무 많기에 그에 따른 계산을 제한된 시간내의 처리가 불가능한 영역으로 간주됐다. 알파고와 이세돌 9단의 게임은 승패와 관계없이 5번의 대국으로 진행됐다. 한국어, 중국어, 일본어, 영어로 실황 생중계되었고 유튜브로 중계됐다. 알파고는 심층신경망을 가진 인공지능 프로그램으로 몬테카를로 트리탐색 알고리즘의 지도학습과 보강된 강화학습을 근간으로 구현됐다. 이세돌 9단은 4번째 대국에서 알파고를 불계승(AlphaGo resigns)으로 이기게 된다.

알파고와 왓슨은 우승 후 바로 인공지능의 확산을 위한 백신과 같은 신약개발, 의료 및 질병진단, 무인자율주행차, 날씨 변화예측, 스마트폰 개인비서 등 사회 전분야와 상업화 영역으로 확대, 접목되며 새로운 발전을 시도했다. 설명된 ‘플루트 연주자’는 안드로이드의 하드웨어 로봇 버전, ‘왓슨과 알파고’는 룰과 프로세스를 기반으로 설계된 소프트웨어 인공지능 버전이다.

생각하는 기계와 중국어 방
컴퓨터 기계와 지능(1950년, Computing machinery and intelligence)에서 튜링은 ‘기계가 생각할 수 있는가?’를 고민하기 시작했고, 인공지능을 판별할 수 있는 방법을 제시했다. 이미테이션 게임으로 불리는 튜링테스트는 기계가 지능을 가지고 있는지에 대한 실험이다. 질문자와 응답자는 벽을 사이에 두고 있다. 질문자의 벽너머에는 사람과 컴퓨터가 각각 배치된다. 그러나 질문자는 벽 너머에 누가 있는지 모른다. 질문자가 질문에 대한 답변을 보고 사람인지, 컴퓨터인지 구분할 수 없다면 컴퓨터는 지능이 있다고 본다.


[그림2] 튜링테스트와 중국어 방

한편 철학자 존설은 1980년, 중국어 방 논증(The Chinese Room Argument)을 제시하며 튜링테스트의 문제를 제기했다.

방에는 중국어를 모르는 사람이 있다. 방에는 준비된 질문과 답변의 리스트가 있다. 밖에 있는 중국인 심사관이 질문지를 방에 전달한다. 방안에서는 질문지를 보고 리스트에서 적당한 답변을 적어서 내 놓는다. 심사관은 답변을 보고 중국어를 잘 안다고 생각한다. 그러나 답변이 리스트를 대조하여 쓰여진 것인지, 정말 이해하고 쓴 것인지 알 수 없기에 튜링테스트로 지능을 평가하기 어렵다고 그는 주장했다.

인공지능과 튜링테스트의 본질?
위험하고 힘든 일 또는 정교한 일은 로봇을 활용한다. 열악한 환경에서 사람의 노동력을 사용하는 것은 바람직한 방법이 아니다. 단순 반복적 노동력이 요구되는 곳에 사람을 배치하는 것도 의미 있는 일은 아닐 것이다. 전자동 첨단 공장에서 정밀한 제품이 생산, 출하된다.

공공기관, 은행 또는 거래처의 콜센터를 접속하거나 홈페이지를 접속한 질문에 챗봇이 대응하고 있다. 병목현상을 만들며 반복되는 단순 프로세스에는 RPA(Robotic Process Automation)가 우선적으로 활용된다. 질문뿐 만 아니라 견적과 신용평가 및 거래요청이 신속하게 답변 된다. 문의했던 내용은 인공지능 기반의 챗봇이나 RPA가 전달하고 컨펌하며, 제출한 서류가 또는 공과금이 잘 접수되고 처리되었다고 알려준다. 

당신은 사람이 제품을 생산해야 한다고 생각하는가? 사람 담당자가 질문에 답변해야 한다고 보는가? 본질은 사람인지 컴퓨터인지가 중요한 게 아니라 적절한 답변을 잘 받았는지, 원하는 것이 효과적으로 처리되었는지가 중요한 것이 아닐까? 그렇다면 우리는 인공지능을 파트너로 수용할 수 있는 것인가? 아니면 룰기반의 프로세스로 대응하는 인공지능의 답변을 받아들일 수 없는가? 나는 생각하지 않는다. 그렇다면 존재하지 않는 것일까?

* 최형광 교수(hk.choi@ssu.ac.kr)는 숭실대 소프트웨어학부에서 강의 중이다. ciokr@idg.co.kr



2021.07.15

최형광 칼럼 | 인공지능과 튜링테스트의 본질?

최형광 | CIO KR
1737년 보캉송은 인간의 연주와 같은 방식으로 직접공기를 불어넣고 손가락으로 연주하는 ‘플루트 연주자’ 자동인형을 제작했다. 2011년 제퍼디(Jeopardy!) 퀴즈게임에서 IBM 왓슨(Watson)은 역대 최대 상금 수상자인 브래드 러터(Brad Rutter)와 최장기 우승자인 켄 제닝스(Ken Jennings)와 대결하여 상금 100만 달러 획득했다. 2016년 구글 딥마인드의 알파고는 서울 포시즌 호텔에서 이세돌 9단과의 대국에서 4승 1패를 기록하고 은퇴했다.

인간을 닮은 로봇
안드로이드(인간을 닮은 로봇, andro-인간 eidos-형상의 합성어)에 대한 도전의 역사는 길다. 자크 드 보캉송이 1737년에 만든 ‘플루트 연주자’는 생체역학 기반의 자동화 구현으로 12곡을 연주할 수 있었다. 플루트 연주자는 1738년 프랑스 아카데미에서 시연됐다. 연주는 15개의 레버에 사슬과 끈을 사용하여 공기를 불어넣어 출력을 만들고, 입술의 움직임, 혀, 손가락의 움직임을 제어하여 구동됐다. 보캉송은 1745년에 세계 최초의 자동 직기를 만들기도 했다.

제퍼디에서 왓슨은 질문에 답변을 해서 이기는 게 아니라 문제의 답에 확신이 있을 때 먼저 버튼을 누르고 정확한 답변을 해야 한다. 틀릴 경우에는 감점이 발생하기에 모르면 응답하면 안 된다. 또한 상금을 베팅하면서 이겨야 한다. 경쟁자는 제퍼디에서 74번 우승한 켄 제닝스, 최고 상금을 수상한 브래드 러터였고 질문은 문맥을 이해할 수 있어야 답변이 가능했다. [그림1]은 플루트 연주자 설계도와 왓슨 DeepQA 아키텍처를 보여주고 있다.


[그림1] 플루트 연주자 설계도와 왓슨 DeepQA 아키텍처. 플루트 연주자는 하드웨어 구현이며 왓슨은 고급 자연어 처리, 의미 분석, 정보 검색, 자동 추론 및 기계 학습을 사용하는 소프트웨어 구현이다.

왓슨은 질문에 대한 복잡한 연결시스템, 융복합된 상호 작용을 위해 AdaptWatson 방법론으로 정보 검색(IR), 자연어 처리(NLP) 및 추론(KRR)등의 접목을 시도했다. 제퍼디 우승자 50여명과 가상의 시뮬레이션 테스트를 거친 후 본 게임에서 우승을 거뒀다. 

그러나, “2차 세계대전 영웅의 이름을 딴 공항과 2차 세계대전 격전지의 이름을 딴 제2의 공항을 가진 곳은 어디인가? 힌트는 미국의 도시” 라는 질문에 두 사람은 정확히 시카고라고 얘기하나 왓슨은 토론토라는 예상외의 답변을 하기도 했다. 시카고에는 미해군 전투기 조종사 ‘에드워드 헨리 오헤어’의 이름을 딴 오헤어 공항과 ‘미드웨이 전투’를 기리기 위한 미드웨이 공항이 있다.

바둑은 인공지능이 인간을 뛰어넘기 가장 어려운 분야로 알려졌다. 체스나 다른 게임과 달리 경우의 수가 너무 많기에 그에 따른 계산을 제한된 시간내의 처리가 불가능한 영역으로 간주됐다. 알파고와 이세돌 9단의 게임은 승패와 관계없이 5번의 대국으로 진행됐다. 한국어, 중국어, 일본어, 영어로 실황 생중계되었고 유튜브로 중계됐다. 알파고는 심층신경망을 가진 인공지능 프로그램으로 몬테카를로 트리탐색 알고리즘의 지도학습과 보강된 강화학습을 근간으로 구현됐다. 이세돌 9단은 4번째 대국에서 알파고를 불계승(AlphaGo resigns)으로 이기게 된다.

알파고와 왓슨은 우승 후 바로 인공지능의 확산을 위한 백신과 같은 신약개발, 의료 및 질병진단, 무인자율주행차, 날씨 변화예측, 스마트폰 개인비서 등 사회 전분야와 상업화 영역으로 확대, 접목되며 새로운 발전을 시도했다. 설명된 ‘플루트 연주자’는 안드로이드의 하드웨어 로봇 버전, ‘왓슨과 알파고’는 룰과 프로세스를 기반으로 설계된 소프트웨어 인공지능 버전이다.

생각하는 기계와 중국어 방
컴퓨터 기계와 지능(1950년, Computing machinery and intelligence)에서 튜링은 ‘기계가 생각할 수 있는가?’를 고민하기 시작했고, 인공지능을 판별할 수 있는 방법을 제시했다. 이미테이션 게임으로 불리는 튜링테스트는 기계가 지능을 가지고 있는지에 대한 실험이다. 질문자와 응답자는 벽을 사이에 두고 있다. 질문자의 벽너머에는 사람과 컴퓨터가 각각 배치된다. 그러나 질문자는 벽 너머에 누가 있는지 모른다. 질문자가 질문에 대한 답변을 보고 사람인지, 컴퓨터인지 구분할 수 없다면 컴퓨터는 지능이 있다고 본다.


[그림2] 튜링테스트와 중국어 방

한편 철학자 존설은 1980년, 중국어 방 논증(The Chinese Room Argument)을 제시하며 튜링테스트의 문제를 제기했다.

방에는 중국어를 모르는 사람이 있다. 방에는 준비된 질문과 답변의 리스트가 있다. 밖에 있는 중국인 심사관이 질문지를 방에 전달한다. 방안에서는 질문지를 보고 리스트에서 적당한 답변을 적어서 내 놓는다. 심사관은 답변을 보고 중국어를 잘 안다고 생각한다. 그러나 답변이 리스트를 대조하여 쓰여진 것인지, 정말 이해하고 쓴 것인지 알 수 없기에 튜링테스트로 지능을 평가하기 어렵다고 그는 주장했다.

인공지능과 튜링테스트의 본질?
위험하고 힘든 일 또는 정교한 일은 로봇을 활용한다. 열악한 환경에서 사람의 노동력을 사용하는 것은 바람직한 방법이 아니다. 단순 반복적 노동력이 요구되는 곳에 사람을 배치하는 것도 의미 있는 일은 아닐 것이다. 전자동 첨단 공장에서 정밀한 제품이 생산, 출하된다.

공공기관, 은행 또는 거래처의 콜센터를 접속하거나 홈페이지를 접속한 질문에 챗봇이 대응하고 있다. 병목현상을 만들며 반복되는 단순 프로세스에는 RPA(Robotic Process Automation)가 우선적으로 활용된다. 질문뿐 만 아니라 견적과 신용평가 및 거래요청이 신속하게 답변 된다. 문의했던 내용은 인공지능 기반의 챗봇이나 RPA가 전달하고 컨펌하며, 제출한 서류가 또는 공과금이 잘 접수되고 처리되었다고 알려준다. 

당신은 사람이 제품을 생산해야 한다고 생각하는가? 사람 담당자가 질문에 답변해야 한다고 보는가? 본질은 사람인지 컴퓨터인지가 중요한 게 아니라 적절한 답변을 잘 받았는지, 원하는 것이 효과적으로 처리되었는지가 중요한 것이 아닐까? 그렇다면 우리는 인공지능을 파트너로 수용할 수 있는 것인가? 아니면 룰기반의 프로세스로 대응하는 인공지능의 답변을 받아들일 수 없는가? 나는 생각하지 않는다. 그렇다면 존재하지 않는 것일까?

* 최형광 교수(hk.choi@ssu.ac.kr)는 숭실대 소프트웨어학부에서 강의 중이다. ciokr@idg.co.kr

X