Offcanvas

AI / 개발자 / 로봇|자동화 / 머신러닝|딥러닝 / 애플리케이션

AI 개발자를 위한 셀프 튜닝 머신러닝 도구··· '글루온' 나왔다

2017.10.16 Serdar Yegulalp  |  InfoWorld
마이크로소프트와 아마존이 협력해 MXNet과 마이크로소프트 코그니티브 툴킷 프레임워크를 함께 이용하기 쉬도록 만들었다.

그간 딥러닝 시스템을 제대로 다루기란 꽤 까다로왔다. 좋은 결과를 얻어내기 위해 필요한 미세 조정 때문이었다. 글루온(Gluon)은 이 미세 조정 작업을 줄이기 위해 마이크로소프트와 AWS과 공동으로 노력한 결과다.

아파치 MXNet마이크로소프트의 코그니티브 툴킷 프레임워크에서 이용할 수 있는 글루온은, 이들 두 시스템에서 딥러닝 네트워크 훈련을 자동으로 최적화하는 역할을 수행한다.

작동 원리
딥러닝 시스템 등에서 이용되는 신경망 네트워크는 대략 다음의 3단계로 작동한다.

- 개발자는 네트워크 행동을 하드코드한다.

- 개발자는 최적의 결과 산출을 위해 데이터가 가중치 설정되고 네트워크에 의해 제어되도록 조정한다.

- 제어 완료된 네투어크가 예측 업무에 이용된다.

1단계와 2단계의 문제점은 지루한데다 그리 유연하지 않다는 점이다. 네트워크를 하드코딩 하는 작업은 느리기 마련이며 네트워크의 동작을 향상시키기 위해 코딩을 변경하는 작업도 느리다.

글루온은 코드라기보다는 데이터 세트와 같은 방식으로 정의된 신경망 네트워크를 작성할 수 있게 해준다. 이를 이용해 개발자는 신경망 레이어 체인과 같은 일반적인 패턴을 사용하여 네트워크를 서술형으로 인스턴스화 할 수 있게 된다. 양사에 따르면 글루온 코드는 작성하기 쉽고 이해하기 쉽도록 만들어졌으며 사용된 언어의 고유 기능(파이썬의 컨텍스트 관리자 등)을 활용한다.

개발자에게 유용한 지점
글루온이 개발자를 돕는 기본적인 개념은 네트워크를 정의하고 수정할 수 있도록 돕는 것이다. 글루온에서 신경방은 변화하지 않는 코드 블록을 사용해 전통적인 방식으로 묘사될 수 있게 된다. 그러나 네트워크는 이와 동시에 마치 데이터 구조인 것처럼 묘사될 수 있다. 따라서 훈련 중에 변경 사항을 반영하기 위해 즉시 변경할 수 있게 된다.

마이크로소프트와 AWS에 따르면 글루온으로 작성된 코드는 MXNet과 코그니티브 툴킷 모두에서 GPU 가속 및 분산 처리 기능을 활용할 수 있으며, 이에 따라 트레이닝 작업을 여러 노드에 분산시킬 수 있다. 양사는 글루온인 수동적 접근 방식에 비해 성능 저하가 없다고 전했다.

글루온 활용처
글루온은 MXNet에서 작동한다. 예를 들어 MXNet의 파이썬 0.11 및 이후 프론트 엔드에는 글루온 라이브러리가 지원된다. 글루온은 또 MXNet의 GPU 가속판과 인텔 매쓰 커널 라이브러리 확장판과 투명하게 공조된다.

마이크로소프트는 아직 글루온을 지원하는 코그니티브 툴킷 버전을 출시하지 않았다. 그러나 다음 번 버전에서는 글루온을 지원할 것이라고 약속했다. ciokr@idg.co.kr
 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.