Offcanvas

AI / 검색|인터넷 / 라이프 / 로봇|자동화 / 머신러닝|딥러닝 / 비즈니스|경제 / 소비자IT / 신기술|미래 / 애플리케이션

칼럼 | 걸러서 듣자··· 인공지능, 머신러닝, 로봇에 대한 숨겨진 진실

2016.06.10 Galen Gruman  |  InfoWorld
개인 비서, 봇, 자율주행 자동차, 그리고 머신러닝이라는 형태로 구현되는 인공지능(Artificial intelligence, AI)이 실리콘 밸리와 IT 미디어, 각종 산업 전시회에서 다시 한 번 화두로 떠올랐다.

AI(Artificial intelligence)는 주기적으로 반복해서 관심을 끌지만 현실 세계에서는 느리게 발전하는 기술 가운데 하나다. 필자는 1980년대 IBM, MIT, 카네기 멜론, 씽킹 머신(Thinking Machine) 등이 열었던 요란한 AI 전시회와, 당시 "옴니(Omni)" 등의 선정적인 잡지의 표지를 장식하곤 했던 재론 래니어와 같은 테크노히피 지지자들을 기억한다.

AI는 과학적 토대는 대부분 확보되었지만 구현이 아직 성숙하지 못한 분야다. 벌거벗은 임금님 수준을 겨우 벗어난 속옷만 입고 있는 상황이라고 할 수 있다. 아직 만들어야 할 옷이 많이 남아 있다.

따라서 요즘 난무하는 지능이 있는 기계/소프트웨어에 관한 꿈 같은 이야기들은 적당히 가감해서 듣는 것이 좋다. 스티븐 스필버그의 "A.I."에 나오는 정도의 인공지능은 물론이고 "스타 트렉" 수준의 대화형 컴퓨터도 아직 수십년 후의 이야기일 뿐이다.

아무튼 전반적인 AI 분야에서 많은 일이 일어나고 있긴 하다. 똑똑한 개발자와 기업들은 당장 현실적으로 가능성 있는 구체적인 분야에 집중할 것이다. 나머지는 아직 SF 작가나 선정적인 미디어의 몫이다.

로봇 공학(Robotics)과 AI는 별도의 분야
영화 "지구가 멈추는 날(The Day the Earth Stood Still)"의 고트부터 미국 드라마 "배틀스타 갤럭티카(Battlestar Galactica)"의 사일론, 아이작 아시모프의 "아이 로봇(I Robot)"에 등장하는 인간형 로봇과 "스타 트렉: 넥스트 제네레이션(Star Trek: The Next Generation)"의 데이터에 이르기까지 인공지능을 가진 로봇은 소설의 단골 소재다.

그러나 로봇은 인공지능이 아니라 이전까지 사람이 했던 작업을 기계적으로, 많은 경우 더 빠르고 안정적으로, 임금이나 복지도 요구하지 않고 수행하는 기계다.

로봇은 제조 분야에서 흔히 사용되며 병원에서도 약물 취급에 사용되고 있다(로봇은 자기가 사용하기 위해 약을 훔치는 일이 없으므로). 그러나 일반 사무실이나 가정에서는 아직 찾아보기 어렵다.

최근 바이오닉스 분야에서 큰 발전이 이루어졌는데, 이런 발전의 주 원동력은 지난 20년 동안 여러 전쟁에서 팔이나 다리를 잃은 참전 용사들이다. 마치 원래 신체의 일부인 것처럼 신경 충동과 뇌파에 반응하는 인공 팔다리가 등장했으며, 머지 않아 지금의 거추장스러운 전선과 외장 컴퓨터 없이도 작동하게 될 것이다.

AI와 로봇을 결합해 결국 사람이 사일론과 같은 기계의 노예가 될 날이 올지도 모르겠지만, 그 정도는 먼 미래에나 논할 이야기다. 그 때까지는 일단 AI의 발전으로 소프트웨어가 더 정교화되고, 그 결과 로봇도 더 정밀하게 작동하게 될 것이다.

현재 초점은 패턴 매칭이지만 정교함은 떨어진다
현재 AI로 언급되는 대부분의 기술, 예를 들어 아마존의 제품 추천, 페이스북의 콘텐츠 추천, 애플 시리의 음성 인식, 구글 지도의 길안내 등은 단순한 패턴 매칭(pattern matching)에 불과하다.

클라우드 컴퓨팅으로 가속화된 데이터 스토리지와 연산 성능의 지속적인 발전 덕분에 더 많은 패턴을 저장, 식별하고 처리할 수 있게 됐다. 지금 하는 작업의 대부분은 패턴 매칭을 기반으로 한다.

즉, 문제를 해결하기 위해 문제에 대해 이미 알고 있는 것을 파악한 다음 이미 알고 있는 해결책을 시도한다. 패턴 매칭이 적절한 행동 또는 결과로 빨리 이어질수록 시스템 지능도 더 높은 것처럼 보인다.

그러나 아직은 초기 단계다. 내비게이션과 같이 상당히 높은 수준까지 발전한 시스템도 있다. 어느 정도로 발전했냐 하면 사람들이 스스로 볼 수 있는 표지판보다 GPS 지시를 더 추종할 정도다. 그래서 공항 활주로와 호수, 눈으로 뒤덮인 시골 도로 등으로 들어가곤 한다.

아무튼 이런 인공지능 시스템은 거의 대부분 멍청하다. 아마존을 방문해서 어떤 제품을 보면, 이후 방문하는 웹사이트의 광고에 이런 제품들이 표시되는 경우가 많다. 사용자가 아마존에서 그 제품을 이미 구입했거나 구입하지 않기로 결심했다면 이 광고는 정말 멍청한 광고다.

그러나 시스템이 아는 것은 오로지 사용자가 X라는 제품을 봤다는 것뿐이고, 그래서 계속 똑같은 제품을 보여준다. 사용자가 기대하는 지능적인 시스템과는 거리가 멀다. 아마존 제품 광고뿐만 아니라 애플의 지니어스 음악 매칭(Genius music-matching) 기능과 구글 나우 추천 기능(Now recommendations) 역시 맥락(context)을 모르긴 마찬가지고, 그래서 매번 똑같은 결과를 반복해서 도출한다.

애플의 자동 수정 기능(autocorrection)과 같이 오히려 역효과를 일으킨다. 이 기능은 사람들의 틀린 문법 습관, 복수형이나 아포스트로피 사용 방법에 대한 무지, 일관성 없는 대/소문자 사용, 오타 따위가 다른 모든 사람에게 강제로 적용되는, 크라우드소싱의 실패를 전형적으로 보여주는 사례다(입력이 극단적으로 서툰 필자와 같은 사람도 이 기능을 끌 때 오히려 오타가 적게 나온다).

사용자가 무엇을 사고 무엇을 거절했는 지와 같은 전후 맥락 파악이 없기 때문에 사용자는 더 관심이 있을 법한 다른 상품에 대한 광고가 아니라 계속 똑같은 광고만 보게 된다.

음악도 마찬가지다. 사용자의 재생 목록이 다양한 곡으로 구성되어 있다면 추천 곡도 다양해야 한다. 구글 나우가 제시하는 추천 음식점도 다를 바 없다. 필자는 인도 음식을 좋아하지만 외식할 때마다 인도 음식점을 가고 싶지는 않다. 좋아하지만 최근에 가지 않은 음식점은 어디인가? 나와 함께 식사할 사람들의 패턴과 기호는 어떻게 처리되는가?

자동 수정도 전후 맥락에 대한 인식이 필요한 영역이다. 첫째, 누군가 애플에게 "its"와 "it's"의 차이점을 알려주고, 영어에는 문법적으로 정확한, 따라서 마땅히 허용되어야 할 여러 변형이 있다는 사실도 알려줘야 한다.

예를 들어 접두사는 단어의 일부가 될 수도 있고(예: preconfigured), 하이픈으로 연결될 수도 있으며(예: pre-configured) 따라서 사용자는 자신의 기호에 따라 둘 중 하나를 사용할 수 있어야 한다("pre configured"와 같이 접두사 뒤에 공백을 넣는 것은 잘못인데, 하이픈으로 연결하지 않으면 애플 자동 수정 기능이 이렇게 입력한다).

자동 수정과 같은 문제 영역이 제대로 작동하기 전까지는 봇(모니터링한 데이터를 기반으로 사용자 대신 작업을 수행하는 자동화 소프트웨어 비서)에게 가장 단순한 작업 이상의 것을 기대하면 안 된다. 사실 봇 역시 자동 수정과 같은 유형의 문제를 겪고 있다.

패턴 식별(Pattern identification)이 머신러닝으로 부상
패턴 매칭은 풍부한 맥락이 포함된다 해도 충분하지 않다. 패턴 매칭에는 사전 정의가 필요하기 때문이다. 그래서 패턴 식별(Pattern identification)이라는 것이 등장했다. 패턴 식별은 소프트웨어가 사용자의 행동을 모니터링함으로써 새로운 패턴 또는 변경된 패턴을 감지하는 것을 의미한다.

즉, 이런 시스템을 뒷받침하는 규칙을 위한 매개변수를 정의해야 하는데, 이는 쉽지 않은 일이다. 너무 큰 단위로 인해 구별되지 않는 무의미한 덩어리에 그치거나 너무 잘게 쪼개져 실제 환경에서 쓸모가 없게 되기 십상이다.

더 많은 클릭과 더 많은 상품 구매 유도, 복사기와 항공기 엔진의 장애 진단, 기상 및 교통 현황에 따른 배송 트럭 경로 수정, 운전 중 위험 대처(미국 자동차에서 충돌 회피 기술은 곧 표준이 됨) 등 목적이 무엇이든, 현재 머신러닝에서는 이러한 식별 작업이 큰 부분을 차지한다.

머신러닝은 어려운 만큼, 특히 세부적으로 정의되고 설계되는 분야를 제외하면 발전 속도는 느리다. 시스템은 계속 개선되지만 그 차이를 인지할 정도가 되려면 꽤 많은 시간이 필요하다.

음성인식이 대표적인 예다. 전화기 기반 도움말 시스템이었던 최초의 음성 인식 시스템은 형편없었지만 지금의 시리, 구글 나우, 코타나의 음성 인식 기능은 많이 발전했다.

여전히 복잡한 구문과 틈새 영역 이해에 서툴고, 여러 억양과 발음 패턴에도 취약함을 드러내는 등 오류가 많긴 해도 실제로 사용할 수 있는 수준은 된다. 사람에 따라서는 실제 필사자의 받아쓰기와 차이가 없다고 느낄 정도다.

그러나 기계는 맥락이 복잡할수록 모델이 불완전하거나 주변 환경에 의해 지나치게 왜곡되므로 학습에 어려움을 겪는다.

자율 주행 자동차가 좋은 예다. 자동차는 도로 패턴과 신호, 다른 자동차를 기반으로 운전하는 방법을 학습할 수 있지만 날씨, 보행자, 자전거 이용자, 2중 주차된 자동차, 도로 공사 등의 외부 요인으로 인해 학습에 큰 혼란이 발생하게 된다. 이러한 요인들은 특이성과 변동성이 커서 식별하기도 어렵다.

이런 모든 장애물을 극복하는 것이 가능할까? 가능하긴 하겠지만 사람들이 생각하는 것만큼 빠른 속도는 아니다.

머신러닝을 뒤따르는 예측 분석
IT는 오랫동안 예측 분석(predictive analytics)이라는 개념을 팔아왔다(운영 비즈니스 인텔리전스(operational business intelligence) 역시 예측 분석의 또 다른 이름이다). 예측 분석은 훌륭한 개념이지만 이를 위해서는 패턴 매칭과 머신러닝, 그리고 인사이트가 필요하다. 인사이트는 새로운 영역으로 사고를 비약할 수 있게 해주는 요소다.

예측 분석은 판에 박힌 사고가 아니라 특이한 패턴과 결과를 식별하고 수용하는 것이다. 이것이 어려운 이유는 패턴 기반의 "인텔리전스"는 다수의 패턴과 경로가 곧 최선의 패턴과 경로라는 가정을 전제로 하기 때문이다. 다수가 아니라는 것은 사람들이 그다지 많이 사용하지 않는다는 의미다.

대부분의 보조 시스템은 현재 조건을 사용해 검증된 경로로 사용자를 안내한다. 예측 시스템은 온갖 종류의 확률 수학을 사용해 현재 조건과 추론 가능한 미래의 조건을 조합한다. 그나마 이것은 쉬운 예측이다.

정말 어려운 문제는 여러 가지 이유로 인해 눈에 잘 띄지 않는 것들이다. 대부분의 사람이 이해할 수 없을 정도로 문맥이 너무 복잡하거나, 계산된 경로가 경계를 벗어나서 알고리즘 또는 사용자에 의해 거부되는 경우가 이에 속한다.

지금까지 살펴본 바와 같이 머신러닝에는 아직 해결해야 할 문제가 많으므로, 자극적인 언론 보도나 구글 I/O 등의 전시회에서 흔히 접하게 되는 놀라운 미래에 관한 이야기는 적당히 걸러서 들어야 한다. 미래는 분명히 다가오지만 느리게, 균일하지 않게 온다. editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.