2017.07.27

알아두면 쓸데있는 '딥러닝 이야기'

Tom Macaulay | Computerworld UK

인공지능은 2035년까지 영국에 6,540억 파운드의 경제 효과를 창출할 것으로 예상된다. 그런데 인공지능이 주류로 자리 잡는 과정에서 인공지능을 기술하는 용어 때문에 혼란이 생기고 있다. 인공지능, 머신러닝, 딥러닝(deep learning)이라고도 하는 유행어가 마치 다 같은 것처럼 쓰이곤 하지만 각각이 의미하는 바는 서로 다르다.



‘인공지능’이라는 말을 처음 만들어낸 사람은 스탠퍼드대학교의 컴퓨터 과학자 존 매카시다. 그는 1956년 관련 주제로 열린 학회에서 인공지능을 “지능적인 기계, 특히 지능적인 컴퓨터 프로그램을 만드는 과학 기술”로 정의했다.

‘지능적’이라는 말은 모호하기 때문에 인공지능은 다양한 분야에서 응용되고 있다. 그러나 대부분 연구원은 인공지능이란 인간의 사고를 똑같이 구현하는 것을 폭넓게 지칭한다는 데 의견을 같이한다.

머신러닝이란 인공지능의 일부분으로서 컴퓨터가 어느 정도 독자적으로 사고할 수 있게 한다. 대량의 데이터를 처리하고 이를 통해 학습할 수 있는 알고리즘을 구현함으로써 미리 프로그램되지 않은 부분에 대해서도 예측과 결정을 내릴 수 있게 하는 방식이다. 기존의 예를 통해 새로운 문제를 푸는 방법이 효과적으로 학습된다.

한편, 딥러닝은 머신러닝의 일종으로서 인간 두뇌에 있는 신경세포들의 연결방식에서 영감을 얻은 것이다. 이러한 생물체의 연결성을 흉내 낸 인공신경네트워크(신경망)가 개발되었다.

딥러닝의 활용
인간의 신경망에는 수십억 개의 신경세포가 서로 연결되어 있으며 이들이 주고받는 전기신호가 생각과 행동으로 발전된다. 인공신경망에서는 노드가 신경세포의 역할을 한다. 조직적인 체계 속에서 움직이는 노드들은 각자 분석한 내용을 모두 합쳐 문제 해결에 활용한다.

예를 들어, 딥러닝 소프트웨어를 활용하면 가득 찬 빨래 바구니처럼 사물이 서로 겹쳐져 있는 복잡한 사진을 이해할 수 있다.

노드들은 따로 떨어진 계층에 배열되어 있으며 각 노드는 사진 속의 개별 요소를 검토한 다음 이를 완전히 이해하기 위한 연산을 한다. 연산 결과로 생성된 신호가 다른 노드로 전달된다.

그 후 계층 내의 모든 신호를 전체적으로 평가하여 사진에 정확히 무엇이 있는지 최종적으로 예측한다.

다른 형태의 머신러닝은 미리 정의된 특징을 분석해서 예측의 기반으로 삼는 반면, 딥러닝은 개별적인 특징 자체를 식별할 수 있다는 것이 장점이다.

예를 들면, 사진에 있는 사람 얼굴들을 식별하고자 할 때 코, 눈동자 등과 같은 개별적인 특징을 제공할 필요가 없다. 사진 전체를 제공하면 이를 검토해 여러 특징을 이해함으로써 사진 내용을 독자적으로 예측할 수 있기 때문이다.

딥러닝은 지진 예측이나 자율 주행 자동차 운전 등에도 활용할 수 있다. 이 밖에도 흑백 비디오에 색깔 입히기, 휴대전화 카메라로 텍스트 번역하기, 사람 목소리 흉내 내기, 작곡하기, 컴퓨터 코드 작성하기 등이 가능하며 보드게임에서 인간을 이길 수도 있다. 작년에 구글 딥마인드(Google DeepMind)가 한국 바둑 챔피언 이세돌과의 대국에서 승리를 거둔 사례가 유명하다.

또한, 기업들의 딥러닝 응용 가능성은 보안 시스템에서부터 감정 분석, 제조 과정 최적화에 이르기까지 무궁무진하다. 딥러닝은 특히 영상과 소리 이해에 능하며 X-레이 분석이나 법률 문서 검토 등 여러 가지 일반적인 전문 작업을 자동화할 수 있다.

딥러닝의 역사
소프트웨어 업체 클라우데라(Cloudera)의 데이터 과학 책임자인 션 오웬은 “딥러닝이 새로운 개념은 아니다. 이미 있던 개념이지만 마침내 제대로 실현해서 재탄생한 것이다”고 설명했다.

딥러닝의 기원은 1950년대로 거슬러 올라간다. ‘지각(perception’이라고 알려진 생물체 두뇌의 상호 연결성을 흉내 내려던 초기의 시도에서 비롯된 것이다. 1957년 미국 심리학자 프랭크 로젠블랫은 미국 해군 연구국(ONR)의 자금 지원을 받아 머신러닝 알고리즘을 개발했다.

당시 뉴욕타임스는 그의 발명품을 두고 “걷고, 이야기하고, 보고, 글을 쓸 수 있을 뿐만 아니라 자기 복제와 자신의 존재 인식이 가능할 것으로 [해군이] 기대를 걸고 있는 전기 컴퓨터의 배아”라며 호들갑을 떨었다.

그 기술은 지나친 복잡성 때문에 곧 사라졌지만 1986년 ‘역전파(back-propagating) 오류에 의한 학습 표현’이라는 제목의 논문이 발표되면서 재등장했다. 이 논문에서 제시된 방식으로 인공신경망의 학습 효율성이 제고됐기 때문이다.

90년대에는 비교적 간단한 고성능 알고리즘을 제공하는 ‘서포트 벡터 머신(support vector machine)’이라는 새로운 종류의 머신러닝이 등장하면서 주목받기 시작했다.

클라우드에서 이용 가능한 방대한 연산 기능을 활용해 대규모의 딥러닝을 가능하게 하는 방법을 제대로 알게 된 것은 불과 지난 10년 동안의 일이다.

2011년, 스탠퍼드 대학교 교수이자 딥러닝의 선구자인 앤드류 응은 구글 브레인(Google Brain)을 만들었다. 그는 이미 자율 운행 헬리콥터와 다용도 가정용 로봇 개발에 기여한 바 있었다. 그러나 그가 인공지능의 상징으로 떠오른 것은 구글의 거대한 인공신경망 연구 프로젝트를 통해서였다.

그는 인간의 두뇌를 모방하기 위해 1만 6,000개의 컴퓨터 프로세서를 한데 모았다. 이들은 유튜브 동영상에 포함된 천만 개의 영상을 검토해 그 안에서 고양이를 인식해 냈고 ‘고양이’의 고유 특징을 독자적으로 알아냈다. 이 성과는 뉴욕타임스에 대서 특필되었다.

구글 브레인에서 개발된 인공신경망은 같은 해 후반기에 (비록 언론의 찬사는 상대적으로 적었지만) 안드로이드 폰의 음성 인식 소프트웨어에서 다시 한번 활용되었다.

구글 브레인은 딥러닝에 대한 주류의 관심을 불러일으켰다. 또한, 간단한 자동화가 지능으로 가장되어 여러 엔지니어들 사이에서 인기를 끌던 당시에 인간 두뇌가 머신러닝의 모델이 될 수 있음을 증명했다.

구글의 전직 수석 엔지니어이기도 했던 오웬은 “딥러닝의 속도가 빨라지고 활용되기 시작한 것은 획기적인 연구 결과 때문이 아니라 이를 가능하게 해주는 소프트웨어가 보급되었기 때문”이라고 설명했다.

그는 “예를 들면, 약 2년 전 구글이 공개한 텐서플로(TensorFlow)라는 딥러닝 패키지 같은 것들이 주류에서 딥러닝이 급속도로 채택되고 이용될 수 있었던 원동력이다”고 설명을 이었다.

오웬에 따르면, 텐서플로로 지난 5년 동안 폭발적인 증가가 이루어졌으며 이는 딥러닝 개념을 무료 소프트웨어로 변환시킨 덕분이다.

딥러닝에 필요한 특수 하드웨어를 구하기도 쉬워졌다. 구하기 더 어려운 것은 다양한 도구와 기술 활용에 필요한 지식과 경험이다.

딥러닝은 아직 많은 부분이 미지의 세계로 남아 있다. 경험이 많은 머신러닝 과학자들조차도 현장에 투입되면 작업 중에 배워야 한다. 이러한 이유로 세계 최대의 기술 업체 사이에서는 인재 쟁탈전이 벌어지고 있다.

2017.07.27

알아두면 쓸데있는 '딥러닝 이야기'

Tom Macaulay | Computerworld UK

인공지능은 2035년까지 영국에 6,540억 파운드의 경제 효과를 창출할 것으로 예상된다. 그런데 인공지능이 주류로 자리 잡는 과정에서 인공지능을 기술하는 용어 때문에 혼란이 생기고 있다. 인공지능, 머신러닝, 딥러닝(deep learning)이라고도 하는 유행어가 마치 다 같은 것처럼 쓰이곤 하지만 각각이 의미하는 바는 서로 다르다.



‘인공지능’이라는 말을 처음 만들어낸 사람은 스탠퍼드대학교의 컴퓨터 과학자 존 매카시다. 그는 1956년 관련 주제로 열린 학회에서 인공지능을 “지능적인 기계, 특히 지능적인 컴퓨터 프로그램을 만드는 과학 기술”로 정의했다.

‘지능적’이라는 말은 모호하기 때문에 인공지능은 다양한 분야에서 응용되고 있다. 그러나 대부분 연구원은 인공지능이란 인간의 사고를 똑같이 구현하는 것을 폭넓게 지칭한다는 데 의견을 같이한다.

머신러닝이란 인공지능의 일부분으로서 컴퓨터가 어느 정도 독자적으로 사고할 수 있게 한다. 대량의 데이터를 처리하고 이를 통해 학습할 수 있는 알고리즘을 구현함으로써 미리 프로그램되지 않은 부분에 대해서도 예측과 결정을 내릴 수 있게 하는 방식이다. 기존의 예를 통해 새로운 문제를 푸는 방법이 효과적으로 학습된다.

한편, 딥러닝은 머신러닝의 일종으로서 인간 두뇌에 있는 신경세포들의 연결방식에서 영감을 얻은 것이다. 이러한 생물체의 연결성을 흉내 낸 인공신경네트워크(신경망)가 개발되었다.

딥러닝의 활용
인간의 신경망에는 수십억 개의 신경세포가 서로 연결되어 있으며 이들이 주고받는 전기신호가 생각과 행동으로 발전된다. 인공신경망에서는 노드가 신경세포의 역할을 한다. 조직적인 체계 속에서 움직이는 노드들은 각자 분석한 내용을 모두 합쳐 문제 해결에 활용한다.

예를 들어, 딥러닝 소프트웨어를 활용하면 가득 찬 빨래 바구니처럼 사물이 서로 겹쳐져 있는 복잡한 사진을 이해할 수 있다.

노드들은 따로 떨어진 계층에 배열되어 있으며 각 노드는 사진 속의 개별 요소를 검토한 다음 이를 완전히 이해하기 위한 연산을 한다. 연산 결과로 생성된 신호가 다른 노드로 전달된다.

그 후 계층 내의 모든 신호를 전체적으로 평가하여 사진에 정확히 무엇이 있는지 최종적으로 예측한다.

다른 형태의 머신러닝은 미리 정의된 특징을 분석해서 예측의 기반으로 삼는 반면, 딥러닝은 개별적인 특징 자체를 식별할 수 있다는 것이 장점이다.

예를 들면, 사진에 있는 사람 얼굴들을 식별하고자 할 때 코, 눈동자 등과 같은 개별적인 특징을 제공할 필요가 없다. 사진 전체를 제공하면 이를 검토해 여러 특징을 이해함으로써 사진 내용을 독자적으로 예측할 수 있기 때문이다.

딥러닝은 지진 예측이나 자율 주행 자동차 운전 등에도 활용할 수 있다. 이 밖에도 흑백 비디오에 색깔 입히기, 휴대전화 카메라로 텍스트 번역하기, 사람 목소리 흉내 내기, 작곡하기, 컴퓨터 코드 작성하기 등이 가능하며 보드게임에서 인간을 이길 수도 있다. 작년에 구글 딥마인드(Google DeepMind)가 한국 바둑 챔피언 이세돌과의 대국에서 승리를 거둔 사례가 유명하다.

또한, 기업들의 딥러닝 응용 가능성은 보안 시스템에서부터 감정 분석, 제조 과정 최적화에 이르기까지 무궁무진하다. 딥러닝은 특히 영상과 소리 이해에 능하며 X-레이 분석이나 법률 문서 검토 등 여러 가지 일반적인 전문 작업을 자동화할 수 있다.

딥러닝의 역사
소프트웨어 업체 클라우데라(Cloudera)의 데이터 과학 책임자인 션 오웬은 “딥러닝이 새로운 개념은 아니다. 이미 있던 개념이지만 마침내 제대로 실현해서 재탄생한 것이다”고 설명했다.

딥러닝의 기원은 1950년대로 거슬러 올라간다. ‘지각(perception’이라고 알려진 생물체 두뇌의 상호 연결성을 흉내 내려던 초기의 시도에서 비롯된 것이다. 1957년 미국 심리학자 프랭크 로젠블랫은 미국 해군 연구국(ONR)의 자금 지원을 받아 머신러닝 알고리즘을 개발했다.

당시 뉴욕타임스는 그의 발명품을 두고 “걷고, 이야기하고, 보고, 글을 쓸 수 있을 뿐만 아니라 자기 복제와 자신의 존재 인식이 가능할 것으로 [해군이] 기대를 걸고 있는 전기 컴퓨터의 배아”라며 호들갑을 떨었다.

그 기술은 지나친 복잡성 때문에 곧 사라졌지만 1986년 ‘역전파(back-propagating) 오류에 의한 학습 표현’이라는 제목의 논문이 발표되면서 재등장했다. 이 논문에서 제시된 방식으로 인공신경망의 학습 효율성이 제고됐기 때문이다.

90년대에는 비교적 간단한 고성능 알고리즘을 제공하는 ‘서포트 벡터 머신(support vector machine)’이라는 새로운 종류의 머신러닝이 등장하면서 주목받기 시작했다.

클라우드에서 이용 가능한 방대한 연산 기능을 활용해 대규모의 딥러닝을 가능하게 하는 방법을 제대로 알게 된 것은 불과 지난 10년 동안의 일이다.

2011년, 스탠퍼드 대학교 교수이자 딥러닝의 선구자인 앤드류 응은 구글 브레인(Google Brain)을 만들었다. 그는 이미 자율 운행 헬리콥터와 다용도 가정용 로봇 개발에 기여한 바 있었다. 그러나 그가 인공지능의 상징으로 떠오른 것은 구글의 거대한 인공신경망 연구 프로젝트를 통해서였다.

그는 인간의 두뇌를 모방하기 위해 1만 6,000개의 컴퓨터 프로세서를 한데 모았다. 이들은 유튜브 동영상에 포함된 천만 개의 영상을 검토해 그 안에서 고양이를 인식해 냈고 ‘고양이’의 고유 특징을 독자적으로 알아냈다. 이 성과는 뉴욕타임스에 대서 특필되었다.

구글 브레인에서 개발된 인공신경망은 같은 해 후반기에 (비록 언론의 찬사는 상대적으로 적었지만) 안드로이드 폰의 음성 인식 소프트웨어에서 다시 한번 활용되었다.

구글 브레인은 딥러닝에 대한 주류의 관심을 불러일으켰다. 또한, 간단한 자동화가 지능으로 가장되어 여러 엔지니어들 사이에서 인기를 끌던 당시에 인간 두뇌가 머신러닝의 모델이 될 수 있음을 증명했다.

구글의 전직 수석 엔지니어이기도 했던 오웬은 “딥러닝의 속도가 빨라지고 활용되기 시작한 것은 획기적인 연구 결과 때문이 아니라 이를 가능하게 해주는 소프트웨어가 보급되었기 때문”이라고 설명했다.

그는 “예를 들면, 약 2년 전 구글이 공개한 텐서플로(TensorFlow)라는 딥러닝 패키지 같은 것들이 주류에서 딥러닝이 급속도로 채택되고 이용될 수 있었던 원동력이다”고 설명을 이었다.

오웬에 따르면, 텐서플로로 지난 5년 동안 폭발적인 증가가 이루어졌으며 이는 딥러닝 개념을 무료 소프트웨어로 변환시킨 덕분이다.

딥러닝에 필요한 특수 하드웨어를 구하기도 쉬워졌다. 구하기 더 어려운 것은 다양한 도구와 기술 활용에 필요한 지식과 경험이다.

딥러닝은 아직 많은 부분이 미지의 세계로 남아 있다. 경험이 많은 머신러닝 과학자들조차도 현장에 투입되면 작업 중에 배워야 한다. 이러한 이유로 세계 최대의 기술 업체 사이에서는 인재 쟁탈전이 벌어지고 있다.

X