2017.03.02

'보편화 다가온다' 딥러닝의 미래에 대한 6가지 예측

James Kobielus | InfoWorld
딥러닝(Deep learning)에는 많은 요소가 있으며 단순하지도 않다.



인공 신경망의 기본 사항을 마스터한 데이터 과학자라 할지라도 회선, 순환, 생성을 비롯한 모든 다계층 딥러닝 알고리듬의 복잡한 내용을 다 따라잡으려면 꽤 많은 시간을 들여야 할 것이다. 딥러닝 혁신이 확산되면서 일반적인 개발자는 쉽게 접근하지 못할만큼 지나치게 기술이 복잡해질 위험도 커지고 있다.

그러나 필자는 2020년 정도가 되면 딥러닝 산업이 제시하는 여러 개념이 대폭 간소화되어 보편적인 개발자도 쉽게 이해하고 활용할 수 있게 되리라고 확신한다. 딥러닝 툴, 플랫폼, 솔루션 간소화를 향한 큰 추세를 보면 다음과 같다.

1. 딥러닝 산업은 핵심 표준 툴 집합을 채택할 것이다
2020년 정도가 되면 딥러닝 커뮤니티는 사실상의 표준이 될 몇 가지 핵심 툴 프레임워크 집합으로 수렴된다. 현재 딥러닝 전문가들이 사용할 수 있는 툴 옵션은 과잉 상태이며 그 대부분은 오픈소스다. 가장 인기있는 툴에는 텐서플로우(TensorFlow), 빅DL(BigDL), 오픈딥(OpenDeep), 카페(Caffe), 씨아노(Theano), 토치(Torch), MX넷(MXNet) 등이 포함된다.

2. 딥러닝은 스파크(Spark) 내에서 네이티브로 지원된다
스파크 커뮤니티는 향후 12~24개월 내에 스파크 플랫폼의 네이티브 딥러닝 기능을 강화할 것이다. 최근 스파크 서밋의 세션 내용을 근거로 판단하면 스파크 커뮤니티는 텐서플로우에 대한 지원을 강화하는 것으로 보이며, 빅DL과 카페, 토치 도입도 증가하고 있다.

3. 딥러닝은 개방형 분석 생태계 내에서 안정적인 틈새 시장을 찾을 것이다
대부분의 딥러닝 환경은 이미 스파크, 하둡(Hadoop), 카프카(Kafka) 및 기타 오픈소스 데이터 분석 플랫폼에 의존하고 있다. 이런 다른 플랫폼이 제공하는 종합적인 빅데이터 분석 기능 없이는 딥러닝 알고리즘을 충분히 교육하거나 관리, 구축할 수 없다는 것이 점차 명확해지고 있다.

특히 스파크는 다양한 툴 내에서 딥러닝 알고리즘을 확장하고 가속화하기 위한 필수 플랫폼으로 자리잡고 있다. 최근 기사에서 필자가 언급했듯이 많은 딥러닝 개발자가 하이퍼파라미터 최적화, 고속 메모리 내 데이터 교육, 데이터 클린징, 전처리와 같은 특수한 파이프라인 작업을 위해 스파크 클러스터를 사용 중이다.

4. 딥러닝 툴은 간소화된 프로그래밍 프레임워크를 도입할 것이다
애플리케이션 개발자 커뮤니티는 더 적은 코드로 더 빠르게 코어 알고리즘 기능을 코딩하기 위해 API와 기타 프로그래밍 추상화를 요구하게 된다. 나아가 딥러닝 개발자들은 끼워 넣을 수 있는 완제품 형태의 다양한 알고리즘 라이브러리에 대한 접근을 제공하는 통합된 개방형 클라우드 기반 개발 환경을 채택할 것이다. 이를 통해 API 기반의 딥 러닝 애플리케이션을 합성 가능한 컨테이너화된 마이크로서비스로 개발할 수 있게 된다.

툴은 더 많은 딥러닝 개발 파이프라인 기능을 자동화하고 노트북 지향의 협업 및 공유 패러다임을 제공한다. 이런 추세가 강화됨에 따라 '코드 50라인으로 만드는 생성 대립 네트워크(파이토치)'와 같은 글 제목도 흔해질 것이다.

5. 딥러닝 툴킷은 재사용 가능한 구성 요소의 시각적 개발을 지원한다
딥러닝 툴킷은 기존 빌딩 블록을 사용해 새로운 모델을 손쉽게 시각적으로 설계, 구성 및 교육하기 위한 모듈형 기능을 채택하게 된다. 이런 재사용 가능한 구성 요소의 상당수는 비슷한 사용 사례를 다룬 이전 프로젝트에서 '전이 학습'을 통해 가져온다.

표준 라이브러리와 인터페이스에 도입된 재사용 가능한 딥러닝 아티팩트는 특징 표현, 신경 노드 계층화, 가중치, 교육 방법, 학습 속도를 비롯한 이전 모델의 관련 특징으로 구성된다.

6. 딥러닝 툴은 모든 디자인 표면에 내장된다
"보편화된 딥러닝"은 결코 먼 이야기가 아니다. 향후 5~10년 내에 딥러닝 개발 툴, 라이브러리, 언어는 모든 소프트웨어 개발 툴킷의 표준 구성 요소가 된다. 사용자 친화적인 딥러닝 개발 기능이 신경망과는 거리가 먼 예술가와 디자이너, 건축가, 제작자들이 사용하는 생성 설계 툴에 내장된다는 것도 중요하다.

이미지 검색, 자동 태깅, 사실적 렌더링, 해상도 향상, 스타일 변형, 가공의 상 개시(fanciful figure inception), 작곡 등의 분야를 위한 딥러닝 기반 툴에 대한 인기가 높아지면 이런 추세도 강화될 것이다.

딥러닝 시장은 대중적인 도입을 향해 발전하면서 데이터 시각화, 비즈니스 인텔리전스, 예측 분석 시장의 전례를 따르게 될 것이다. 이런 모든 분야의 솔루션은 기술적 복잡함에 시달리기를 싫어하는 사용자에게 빠른 가치를 제공하는 셀프 서비스 클라우드 기반 제공 모델로 전환됐다. 기술은 그렇게 발전한다. editor@itworld.co.kr  



2017.03.02

'보편화 다가온다' 딥러닝의 미래에 대한 6가지 예측

James Kobielus | InfoWorld
딥러닝(Deep learning)에는 많은 요소가 있으며 단순하지도 않다.



인공 신경망의 기본 사항을 마스터한 데이터 과학자라 할지라도 회선, 순환, 생성을 비롯한 모든 다계층 딥러닝 알고리듬의 복잡한 내용을 다 따라잡으려면 꽤 많은 시간을 들여야 할 것이다. 딥러닝 혁신이 확산되면서 일반적인 개발자는 쉽게 접근하지 못할만큼 지나치게 기술이 복잡해질 위험도 커지고 있다.

그러나 필자는 2020년 정도가 되면 딥러닝 산업이 제시하는 여러 개념이 대폭 간소화되어 보편적인 개발자도 쉽게 이해하고 활용할 수 있게 되리라고 확신한다. 딥러닝 툴, 플랫폼, 솔루션 간소화를 향한 큰 추세를 보면 다음과 같다.

1. 딥러닝 산업은 핵심 표준 툴 집합을 채택할 것이다
2020년 정도가 되면 딥러닝 커뮤니티는 사실상의 표준이 될 몇 가지 핵심 툴 프레임워크 집합으로 수렴된다. 현재 딥러닝 전문가들이 사용할 수 있는 툴 옵션은 과잉 상태이며 그 대부분은 오픈소스다. 가장 인기있는 툴에는 텐서플로우(TensorFlow), 빅DL(BigDL), 오픈딥(OpenDeep), 카페(Caffe), 씨아노(Theano), 토치(Torch), MX넷(MXNet) 등이 포함된다.

2. 딥러닝은 스파크(Spark) 내에서 네이티브로 지원된다
스파크 커뮤니티는 향후 12~24개월 내에 스파크 플랫폼의 네이티브 딥러닝 기능을 강화할 것이다. 최근 스파크 서밋의 세션 내용을 근거로 판단하면 스파크 커뮤니티는 텐서플로우에 대한 지원을 강화하는 것으로 보이며, 빅DL과 카페, 토치 도입도 증가하고 있다.

3. 딥러닝은 개방형 분석 생태계 내에서 안정적인 틈새 시장을 찾을 것이다
대부분의 딥러닝 환경은 이미 스파크, 하둡(Hadoop), 카프카(Kafka) 및 기타 오픈소스 데이터 분석 플랫폼에 의존하고 있다. 이런 다른 플랫폼이 제공하는 종합적인 빅데이터 분석 기능 없이는 딥러닝 알고리즘을 충분히 교육하거나 관리, 구축할 수 없다는 것이 점차 명확해지고 있다.

특히 스파크는 다양한 툴 내에서 딥러닝 알고리즘을 확장하고 가속화하기 위한 필수 플랫폼으로 자리잡고 있다. 최근 기사에서 필자가 언급했듯이 많은 딥러닝 개발자가 하이퍼파라미터 최적화, 고속 메모리 내 데이터 교육, 데이터 클린징, 전처리와 같은 특수한 파이프라인 작업을 위해 스파크 클러스터를 사용 중이다.

4. 딥러닝 툴은 간소화된 프로그래밍 프레임워크를 도입할 것이다
애플리케이션 개발자 커뮤니티는 더 적은 코드로 더 빠르게 코어 알고리즘 기능을 코딩하기 위해 API와 기타 프로그래밍 추상화를 요구하게 된다. 나아가 딥러닝 개발자들은 끼워 넣을 수 있는 완제품 형태의 다양한 알고리즘 라이브러리에 대한 접근을 제공하는 통합된 개방형 클라우드 기반 개발 환경을 채택할 것이다. 이를 통해 API 기반의 딥 러닝 애플리케이션을 합성 가능한 컨테이너화된 마이크로서비스로 개발할 수 있게 된다.

툴은 더 많은 딥러닝 개발 파이프라인 기능을 자동화하고 노트북 지향의 협업 및 공유 패러다임을 제공한다. 이런 추세가 강화됨에 따라 '코드 50라인으로 만드는 생성 대립 네트워크(파이토치)'와 같은 글 제목도 흔해질 것이다.

5. 딥러닝 툴킷은 재사용 가능한 구성 요소의 시각적 개발을 지원한다
딥러닝 툴킷은 기존 빌딩 블록을 사용해 새로운 모델을 손쉽게 시각적으로 설계, 구성 및 교육하기 위한 모듈형 기능을 채택하게 된다. 이런 재사용 가능한 구성 요소의 상당수는 비슷한 사용 사례를 다룬 이전 프로젝트에서 '전이 학습'을 통해 가져온다.

표준 라이브러리와 인터페이스에 도입된 재사용 가능한 딥러닝 아티팩트는 특징 표현, 신경 노드 계층화, 가중치, 교육 방법, 학습 속도를 비롯한 이전 모델의 관련 특징으로 구성된다.

6. 딥러닝 툴은 모든 디자인 표면에 내장된다
"보편화된 딥러닝"은 결코 먼 이야기가 아니다. 향후 5~10년 내에 딥러닝 개발 툴, 라이브러리, 언어는 모든 소프트웨어 개발 툴킷의 표준 구성 요소가 된다. 사용자 친화적인 딥러닝 개발 기능이 신경망과는 거리가 먼 예술가와 디자이너, 건축가, 제작자들이 사용하는 생성 설계 툴에 내장된다는 것도 중요하다.

이미지 검색, 자동 태깅, 사실적 렌더링, 해상도 향상, 스타일 변형, 가공의 상 개시(fanciful figure inception), 작곡 등의 분야를 위한 딥러닝 기반 툴에 대한 인기가 높아지면 이런 추세도 강화될 것이다.

딥러닝 시장은 대중적인 도입을 향해 발전하면서 데이터 시각화, 비즈니스 인텔리전스, 예측 분석 시장의 전례를 따르게 될 것이다. 이런 모든 분야의 솔루션은 기술적 복잡함에 시달리기를 싫어하는 사용자에게 빠른 가치를 제공하는 셀프 서비스 클라우드 기반 제공 모델로 전환됐다. 기술은 그렇게 발전한다. editor@itworld.co.kr  

X