알아두면 쓸데있는 '딥러닝 이야기'

Computerworld UK

인공지능은 2035년까지 영국에 6,540억 파운드의 경제 효과를 창출할 것으로 예상된다. 그런데 인공지능이 주류로 자리 잡는 과정에서 인공지능을 기술하는 용어 때문에 혼란이 생기고 있다. 인공지능, 머신러닝, 딥러닝(deep learning)이라고도 하는 유행어가 마치 다 같은 것처럼 쓰이곤 하지만 각각이 의미하는 바는 서로 다르다.



‘인공지능’이라는 말을 처음 만들어낸 사람은 스탠퍼드대학교의 컴퓨터 과학자 존 매카시다. 그는 1956년 관련 주제로 열린 학회에서 인공지능을 “지능적인 기계, 특히 지능적인 컴퓨터 프로그램을 만드는 과학 기술”로 정의했다.

‘지능적’이라는 말은 모호하기 때문에 인공지능은 다양한 분야에서 응용되고 있다. 그러나 대부분 연구원은 인공지능이란 인간의 사고를 똑같이 구현하는 것을 폭넓게 지칭한다는 데 의견을 같이한다.

머신러닝이란 인공지능의 일부분으로서 컴퓨터가 어느 정도 독자적으로 사고할 수 있게 한다. 대량의 데이터를 처리하고 이를 통해 학습할 수 있는 알고리즘을 구현함으로써 미리 프로그램되지 않은 부분에 대해서도 예측과 결정을 내릴 수 있게 하는 방식이다. 기존의 예를 통해 새로운 문제를 푸는 방법이 효과적으로 학습된다.

한편, 딥러닝은 머신러닝의 일종으로서 인간 두뇌에 있는 신경세포들의 연결방식에서 영감을 얻은 것이다. 이러한 생물체의 연결성을 흉내 낸 인공신경네트워크(신경망)가 개발되었다.

딥러닝의 활용
인간의 신경망에는 수십억 개의 신경세포가 서로 연결되어 있으며 이들이 주고받는 전기신호가 생각과 행동으로 발전된다. 인공신경망에서는 노드가 신경세포의 역할을 한다. 조직적인 체계 속에서 움직이는 노드들은 각자 분석한 내용을 모두 합쳐 문제 해결에 활용한다.

예를 들어, 딥러닝 소프트웨어를 활용하면 가득 찬 빨래 바구니처럼 사물이 서로 겹쳐져 있는 복잡한 사진을 이해할 수 있다.

노드들은 따로 떨어진 계층에 배열되어 있으며 각 노드는 사진 속의 개별 요소를 검토한 다음 이를 완전히 이해하기 위한 연산을 한다. 연산 결과로 생성된 신호가 다른 노드로 전달된다.

그 후 계층 내의 모든 신호를 전체적으로 평가하여 사진에 정확히 무엇이 있는지 최종적으로 예측한다.

다른 형태의 머신러닝은 미리 정의된 특징을 분석해서 예측의 기반으로 삼는 반면, 딥러닝은 개별적인 특징 자체를 식별할 수 있다는 것이 장점이다.

예를 들면, 사진에 있는 사람 얼굴들을 식별하고자 할 때 코, 눈동자 등과 같은 개별적인 특징을 제공할 필요가 없다. 사진 전체를 제공하면 이를 검토해 여러 특징을 이해함으로써 사진 내용을 독자적으로 예측할 수 있기 때문이다.

딥러닝은 지진 예측이나 자율 주행 자동차 운전 등에도 활용할 수 있다. 이 밖에도 흑백 비디오에 색깔 입히기, 휴대전화 카메라로 텍스트 번역하기, 사람 목소리 흉내 내기, 작곡하기, 컴퓨터 코드 작성하기 등이 가능하며 보드게임에서 인간을 이길 수도 있다. 작년에 구글 딥마인드(Google DeepMind)가 한국 바둑 챔피언 이세돌과의 대국에서 승리를 거둔 사례가 유명하다.

또한, 기업들의 딥러닝 응용 가능성은 보안 시스템에서부터 감정 분석, 제조 과정 최적화에 이르기까지 무궁무진하다. 딥러닝은 특히 영상과 소리 이해에 능하며 X-레이 분석이나 법률 문서 검토 등 여러 가지 일반적인 전문 작업을 자동화할 수 있다.

딥러닝의 역사
소프트웨어 업체 클라우데라(Cloudera)의 데이터 과학 책임자인 션 오웬은 “딥러닝이 새로운 개념은 아니다. 이미 있던 개념이지만 마침내 제대로 실현해서 재탄생한 것이다”고 설명했다.

딥러닝의 기원은 1950년대로 거슬러 올라간다. ‘지각(perception’이라고 알려진 생물체 두뇌의 상호 연결성을 흉내 내려던 초기의 시도에서 비롯된 것이다. 1957년 미국 심리학자 프랭크 로젠블랫은 미국 해군 연구국(ONR)의 자금 지원을 받아 머신러닝 알고리즘을 개발했다.

당시 뉴욕타임스는 그의 발명품을 두고 “걷고, 이야기하고, 보고, 글을 쓸 수 있을 뿐만 아니라 자기 복제와 자신의 존재 인식이 가능할 것으로 [해군이] 기대를 걸고 있는 전기 컴퓨터의 배아”라며 호들갑을 떨었다.

그 기술은 지나친 복잡성 때문에 곧 사라졌지만 1986년 ‘역전파(back-propagating) 오류에 의한 학습 표현’이라는 제목의 논문이 발표되면서 재등장했다. 이 논문에서 제시된 방식으로 인공신경망의 학습 효율성이 제고됐기 때문이다.

90년대에는 비교적 간단한 고성능 알고리즘을 제공하는 ‘서포트 벡터 머신(support vector machine)’이라는 새로운 종류의 머신러닝이 등장하면서 주목받기 시작했다.

클라우드에서 이용 가능한 방대한 연산 기능을 활용해 대규모의 딥러닝을 가능하게 하는 방법을 제대로 알게 된 것은 불과 지난 10년 동안의 일이다.

2011년, 스탠퍼드 대학교 교수이자 딥러닝의 선구자인 앤드류 응은 구글 브레인(Google Brain)을 만들었다. 그는 이미 자율 운행 헬리콥터와 다용도 가정용 로봇 개발에 기여한 바 있었다. 그러나 그가 인공지능의 상징으로 떠오른 것은 구글의 거대한 인공신경망 연구 프로젝트를 통해서였다.

그는 인간의 두뇌를 모방하기 위해 1만 6,000개의 컴퓨터 프로세서를 한데 모았다. 이들은 유튜브 동영상에 포함된 천만 개의 영상을 검토해 그 안에서 고양이를 인식해 냈고 ‘고양이’의 고유 특징을 독자적으로 알아냈다. 이 성과는 뉴욕타임스에 대서 특필되었다.

구글 브레인에서 개발된 인공신경망은 같은 해 후반기에 (비록 언론의 찬사는 상대적으로 적었지만) 안드로이드 폰의 음성 인식 소프트웨어에서 다시 한번 활용되었다.

구글 브레인은 딥러닝에 대한 주류의 관심을 불러일으켰다. 또한, 간단한 자동화가 지능으로 가장되어 여러 엔지니어들 사이에서 인기를 끌던 당시에 인간 두뇌가 머신러닝의 모델이 될 수 있음을 증명했다.

구글의 전직 수석 엔지니어이기도 했던 오웬은 “딥러닝의 속도가 빨라지고 활용되기 시작한 것은 획기적인 연구 결과 때문이 아니라 이를 가능하게 해주는 소프트웨어가 보급되었기 때문”이라고 설명했다.

그는 “예를 들면, 약 2년 전 구글이 공개한 텐서플로(TensorFlow)라는 딥러닝 패키지 같은 것들이 주류에서 딥러닝이 급속도로 채택되고 이용될 수 있었던 원동력이다”고 설명을 이었다.

오웬에 따르면, 텐서플로로 지난 5년 동안 폭발적인 증가가 이루어졌으며 이는 딥러닝 개념을 무료 소프트웨어로 변환시킨 덕분이다.

딥러닝에 필요한 특수 하드웨어를 구하기도 쉬워졌다. 구하기 더 어려운 것은 다양한 도구와 기술 활용에 필요한 지식과 경험이다.

딥러닝은 아직 많은 부분이 미지의 세계로 남아 있다. 경험이 많은 머신러닝 과학자들조차도 현장에 투입되면 작업 중에 배워야 한다. 이러한 이유로 세계 최대의 기술 업체 사이에서는 인재 쟁탈전이 벌어지고 있다.

 
딥러닝의 한계
인공지능에 대한 근래 언론의 반응은 엇갈리고 있다. 최근 딥마인드 헬스(DeepMind Health)의 NHS 환자 기록 접근으로 불거진 논란으로 인해 개인정보 보호에 대한 우려가 제기됐다. 딥러닝의 모델이 복잡해짐에 따라 결과를 해석하기 어려워지기 때문에 딥러닝의 과제는 독특하다.

숫자가 엄청나게 많은 매우 복잡한 모델인 데다 숫자의 의미가 명확하지 않기 때문에 왜 결과가 특정 입력 값과 연관이 있는지 이해하기가 쉽지 않다.

오웬은 “모델링의 결과가 의도한 것과 다르고 이를 발견하는데 투명성이 필요하다면 문제가 될 수 있다. 이러한 도구들은 데이터에 숨어 있는 잠재적인 편향을 너무 쉽게 알아챌 수 있고 향후 행위를 추천하는 예측 모델을 구축함으로써 이를 더욱 간직한다는 것이 문제라고 생각한다”고 전했다.

MIT의 한 연구팀이 해답을 찾은 것인지도 모른다. 이들은 신경망 내의 다른 여러 신경세포들의 활동을 분석하여 어떤 개별 신경 세포가 특정 결정을 내리는 일을 담당하는지 파악해 냈다. 이를 통해 알고리즘 편향을 발견하고 딥러닝 알고리즘에서 추론한 특정 행동을 설명할 수 있는 방식이 제공될 수 있다.

비록 딥러닝은 신경세포의 작동 방식에 대한 통계적인 모델을 만들려는 시도로 시작했지만, 아직 인간 두뇌와 똑같은 사고와 학습을 재현하지는 않는다는 점을 오웬은 강조했다.

오웬은 “기계가 생각하도록 만드는 방법이 발견됐다고 착각하기 쉽지만 사실이 아니다. 현재의 모델은 여러 가지 기술들이 혼합되어 있어 강력하지만 통계 모델에 가깝다. 인간 두뇌를 이해할 수 있는 실질적이고 근본적인 돌파구는 아직 없다”고 이야기했다.

딥러닝이 성장한다고 해서 다른 머신러닝 알고리즘이 쓸모없어지는 것도 아니다. 딥러닝이 효과적으로 기능하려면 방대한 데이터세트와 연산 능력이 필요하다. 많은 경우에는 서포트 벡터 머신과 같은 보다 간단한 알고리즘으로도 충분하다.

딥러닝의 미래
딥러닝은 일반적인 지도학습(supervised learning) 기술을 사용할 수 있고 그 대안으로 나온 더 복잡하고 최첨단인 비지도 학습(unsupervised learning)도 사용할 수 있다.

지도학습에서는 입력 변수와 출력 변수가 모두 제공되고 분류된다. 입력 데이터 추가에 따른 새로운 결과를 생성하려면 알고리즘은 이미 확립된 프로세스를 따르기만 하면 된다. 이 방식은 현재 아마존 추천하기 등 여러 가지 애플리케이션에서 활용되고 있다.

비지도학습에서는 출력 데이터를 알 수 없으므로 시스템이 결론을 내릴 때 기준이 될 예가 존재하지 않는다. 오직 입력 데이터만을 이용해 문제를 풀 수 있다. 데이터에서 정보를 추출해 상관관계를 밝힌 다음 근본 구조를 파악함으로써 스스로 결론을 도출한다. 이는 지도학습에서 사용되는 교실 내 교사 모델을 대신할 독학 모델이다.

비지도학습의 예로는 사진 속에 있는 동물을 사전 정보 없이 독자적으로 분류하는 시스템을 들 수 있다. 차이점과 유사점을 기준으로 한 범주로 데이터를 나누는 작업이 수반된다. 따라서 개와 고양이는 픽셀에서 확인할 수 있는 특징과 상관관계를 기준으로 서로 다른 것으로 분류된다.

딥러닝을 활용하면 대가의 스타일과 붓놀림을 흉내 낸 그림으로 스마트폰 사진을 변환할 수 있다. 이 기술 덕분에 러시아의 모바일 앱 프리즈마(Prisma)는 러시아를 대표하는 앱으로 자리 잡았다.

이처럼 강력한 기술의 영향으로 좋지 않은 결과가 초래될 수 있다. 예를 들면 아주 그럴듯한 가짜 동영상 제작에 악용될 수도 있다.

매체 조작과 허위 정보에 악용될 가능성은 스탠퍼드 대학교와 독일의 에를랑겐-뉘른베르크 대학교(University of Erlangen-Nuremberg)의 페이스투페이스(Face2Face)라는 연구 프로젝트가 작년에 공개되었을 때 드러났다.
이 프로그램은 딥러닝 알고리즘과 상용 웹캠을 이용해 유튜브 동영상에서 말하는 사람의 표정을 실시간으로 바꿀 수 있다. 이제 정치인들이 어떤 말을 하는 것처럼 보이게 만드는 것은 식은 죽 먹기가 되었다.

기업에서의 딥러닝
기업들로서는 잠재적인 사업적인 이득이 크다면 딥러닝에 대한 우려를 떨칠 수 있다. 이미 온라인 여행사 익스피디아(Expedia)를 비롯한 여러 기업이 딥러닝을 폭넓게 활용하고 있다.

예약 웹사이트의 고객들은 호텔들을 검토할 때 숙소 사진에 먼저 관심이 가게 마련이다. 가장 매력적인 사진을 먼저 표시할수록 호텔이 선택될 확률이 높아질 것이다. 그러나 295,000개에 달하는 호텔의 사진을 모두 합하면 천만 개가 넘는다. 이를 일일이 직접 검토하려면 끝이 없을 것이다.

따라서, 데이터 과학팀은 딥러닝을 이용해 사진 순위를 자동으로 매기고 있다. 아마존에서 개발한 휴먼 터크(Human Turk)라고 하는 크라우드소싱 제품을 이용해 10만 개의 호텔 사진에 1에서 10 사이의 점수를 주었다. 각각의 사진은 두 차례에 걸쳐 평가된 후 여행자 유형별로 분류되었다.

그 후 이 데이터세트에 대한 훈련을 거쳐 독자적인 사진 분류가 가능해졌다. 익스피디아 측에서는 하루에 천만 개의 사진에 대한 순위를 매길 수 있을 것으로 보고 있다.

기술 회사들은 다양한 딥러닝 활용법을 실험 중이다. 테슬라(Tesla)는 딥러닝을 활용해 자율 주행 자동차들이 도로상의 위험을 파악할 수 있도록 학습시키고 있으며, 딥마인드는 눈의 디지털 스캔 분석을 통해 시력을 위협하는 질병을 탐지해 내고 페이스북은 사용자의 관심사와 관련된 콘텐츠를 제공하는 데 딥러닝을 각각 활용 중이다.

딥러닝은 주로 디지털 우선 업체의 지지를 받고 있지만 그 기술이 점점 정교해지고 있으며 저렴한 가격에 이용 가능해지고 있다. 딥러닝이 모든 분야의 기업들을 탈바꿈시킬 가능성이 커지고 있다. ciokr@idg.co.kr