Offcanvas
2017.07.27 Tom Macaulay  |  Computerworld UK

 
딥러닝의 한계
인공지능에 대한 근래 언론의 반응은 엇갈리고 있다. 최근 딥마인드 헬스(DeepMind Health)의 NHS 환자 기록 접근으로 불거진 논란으로 인해 개인정보 보호에 대한 우려가 제기됐다. 딥러닝의 모델이 복잡해짐에 따라 결과를 해석하기 어려워지기 때문에 딥러닝의 과제는 독특하다.

숫자가 엄청나게 많은 매우 복잡한 모델인 데다 숫자의 의미가 명확하지 않기 때문에 왜 결과가 특정 입력 값과 연관이 있는지 이해하기가 쉽지 않다.

오웬은 “모델링의 결과가 의도한 것과 다르고 이를 발견하는데 투명성이 필요하다면 문제가 될 수 있다. 이러한 도구들은 데이터에 숨어 있는 잠재적인 편향을 너무 쉽게 알아챌 수 있고 향후 행위를 추천하는 예측 모델을 구축함으로써 이를 더욱 간직한다는 것이 문제라고 생각한다”고 전했다.

MIT의 한 연구팀이 해답을 찾은 것인지도 모른다. 이들은 신경망 내의 다른 여러 신경세포들의 활동을 분석하여 어떤 개별 신경 세포가 특정 결정을 내리는 일을 담당하는지 파악해 냈다. 이를 통해 알고리즘 편향을 발견하고 딥러닝 알고리즘에서 추론한 특정 행동을 설명할 수 있는 방식이 제공될 수 있다.

비록 딥러닝은 신경세포의 작동 방식에 대한 통계적인 모델을 만들려는 시도로 시작했지만, 아직 인간 두뇌와 똑같은 사고와 학습을 재현하지는 않는다는 점을 오웬은 강조했다.

오웬은 “기계가 생각하도록 만드는 방법이 발견됐다고 착각하기 쉽지만 사실이 아니다. 현재의 모델은 여러 가지 기술들이 혼합되어 있어 강력하지만 통계 모델에 가깝다. 인간 두뇌를 이해할 수 있는 실질적이고 근본적인 돌파구는 아직 없다”고 이야기했다.

딥러닝이 성장한다고 해서 다른 머신러닝 알고리즘이 쓸모없어지는 것도 아니다. 딥러닝이 효과적으로 기능하려면 방대한 데이터세트와 연산 능력이 필요하다. 많은 경우에는 서포트 벡터 머신과 같은 보다 간단한 알고리즘으로도 충분하다.

딥러닝의 미래
딥러닝은 일반적인 지도학습(supervised learning) 기술을 사용할 수 있고 그 대안으로 나온 더 복잡하고 최첨단인 비지도 학습(unsupervised learning)도 사용할 수 있다.

지도학습에서는 입력 변수와 출력 변수가 모두 제공되고 분류된다. 입력 데이터 추가에 따른 새로운 결과를 생성하려면 알고리즘은 이미 확립된 프로세스를 따르기만 하면 된다. 이 방식은 현재 아마존 추천하기 등 여러 가지 애플리케이션에서 활용되고 있다.

비지도학습에서는 출력 데이터를 알 수 없으므로 시스템이 결론을 내릴 때 기준이 될 예가 존재하지 않는다. 오직 입력 데이터만을 이용해 문제를 풀 수 있다. 데이터에서 정보를 추출해 상관관계를 밝힌 다음 근본 구조를 파악함으로써 스스로 결론을 도출한다. 이는 지도학습에서 사용되는 교실 내 교사 모델을 대신할 독학 모델이다.

비지도학습의 예로는 사진 속에 있는 동물을 사전 정보 없이 독자적으로 분류하는 시스템을 들 수 있다. 차이점과 유사점을 기준으로 한 범주로 데이터를 나누는 작업이 수반된다. 따라서 개와 고양이는 픽셀에서 확인할 수 있는 특징과 상관관계를 기준으로 서로 다른 것으로 분류된다.

딥러닝을 활용하면 대가의 스타일과 붓놀림을 흉내 낸 그림으로 스마트폰 사진을 변환할 수 있다. 이 기술 덕분에 러시아의 모바일 앱 프리즈마(Prisma)는 러시아를 대표하는 앱으로 자리 잡았다.

이처럼 강력한 기술의 영향으로 좋지 않은 결과가 초래될 수 있다. 예를 들면 아주 그럴듯한 가짜 동영상 제작에 악용될 수도 있다.

매체 조작과 허위 정보에 악용될 가능성은 스탠퍼드 대학교와 독일의 에를랑겐-뉘른베르크 대학교(University of Erlangen-Nuremberg)의 페이스투페이스(Face2Face)라는 연구 프로젝트가 작년에 공개되었을 때 드러났다.
이 프로그램은 딥러닝 알고리즘과 상용 웹캠을 이용해 유튜브 동영상에서 말하는 사람의 표정을 실시간으로 바꿀 수 있다. 이제 정치인들이 어떤 말을 하는 것처럼 보이게 만드는 것은 식은 죽 먹기가 되었다.

기업에서의 딥러닝
기업들로서는 잠재적인 사업적인 이득이 크다면 딥러닝에 대한 우려를 떨칠 수 있다. 이미 온라인 여행사 익스피디아(Expedia)를 비롯한 여러 기업이 딥러닝을 폭넓게 활용하고 있다.

예약 웹사이트의 고객들은 호텔들을 검토할 때 숙소 사진에 먼저 관심이 가게 마련이다. 가장 매력적인 사진을 먼저 표시할수록 호텔이 선택될 확률이 높아질 것이다. 그러나 295,000개에 달하는 호텔의 사진을 모두 합하면 천만 개가 넘는다. 이를 일일이 직접 검토하려면 끝이 없을 것이다.

따라서, 데이터 과학팀은 딥러닝을 이용해 사진 순위를 자동으로 매기고 있다. 아마존에서 개발한 휴먼 터크(Human Turk)라고 하는 크라우드소싱 제품을 이용해 10만 개의 호텔 사진에 1에서 10 사이의 점수를 주었다. 각각의 사진은 두 차례에 걸쳐 평가된 후 여행자 유형별로 분류되었다.

그 후 이 데이터세트에 대한 훈련을 거쳐 독자적인 사진 분류가 가능해졌다. 익스피디아 측에서는 하루에 천만 개의 사진에 대한 순위를 매길 수 있을 것으로 보고 있다.

기술 회사들은 다양한 딥러닝 활용법을 실험 중이다. 테슬라(Tesla)는 딥러닝을 활용해 자율 주행 자동차들이 도로상의 위험을 파악할 수 있도록 학습시키고 있으며, 딥마인드는 눈의 디지털 스캔 분석을 통해 시력을 위협하는 질병을 탐지해 내고 페이스북은 사용자의 관심사와 관련된 콘텐츠를 제공하는 데 딥러닝을 각각 활용 중이다.

딥러닝은 주로 디지털 우선 업체의 지지를 받고 있지만 그 기술이 점점 정교해지고 있으며 저렴한 가격에 이용 가능해지고 있다. 딥러닝이 모든 분야의 기업들을 탈바꿈시킬 가능성이 커지고 있다. ciokr@idg.co.kr
 

CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.