Offcanvas

���������������

'데이터 과학자 없는 머신러닝' AutoML의 이해

머신러닝(전통적인 머신러닝과 딥러닝 모두) 사용을 가로막는 두 가지 가장 큰 장애물은 기술력과 컴퓨팅 자원이다. 여기서 컴퓨팅 자원 문제는 가속 하드웨어(고성능 GPU를 탑재한 컴퓨터 등)를 구매하거나 클라우드의 컴퓨팅 자원(예를 들어 GPU, TPU, FPGA가 연결된 인스턴스)를 임대하는 방식으로, 즉 돈을 들여서 해결할 수 있다. 그러나 기술력 문제를 해결하기는 어렵다. 데이터 과학자는 인건비가 상당히 비싼 경우가 많고, 그나마도 찾기 힘들다. 구글은 많은 자체 직원들에게 텐서플로우(TensorFlow) 프레임워크를 교육시켰지만, 일반 기업은 교육은 커녕 스스로 머신러닝 및 딥러닝 모델을 구축할 만큼의 기술력 있는 인력도 갖추지 못한 경우가 많다.   AutoML이란? 자동화된 머신러닝, 즉 AutoML은 머신러닝과 딥러닝 모델을 구축하는 데 있어 기술력을 갖춘 데이터 과학자란 필요조건을 제거하는 데 목적을 둔다. AutoML 시스템을 사용하면 레이블링된 학습 데이터를 입력으로 제공하고 최적화된 모델을 출력으로 받을 수 있다. 방법은 두 가지다. 하나는 소프트웨어에서 단순히 데이터에 대해 모든 종류의 모델을 학습시킨 다음 가장 결과가 좋은 모델을 선택하는 방법이다. 이를 개량하는 방법 중 하나는 다른 모델을 결합하는 하나 이상의 앙상블 모델을 만드는 것이다. 이렇게 하면 (항상 그렇지는 않지만) 더 나은 결과를 얻을 수도 있다. 두 번째 방법은 최적 모델의 초매개변수(hyperparameter)를 최적화해서 더 나은 모델을 학습시키는 것이다. 특성 엔지니어링(Feature Engineering)은 모든 모델 학습에서 유용하다. 딥러닝의 탈숙련화 방법 중 하나는 전이 학습(Transfer Learning)을 사용해서 기본적으로 잘 학습된 범용 모델을 특정 데이터에 대해 맞춤 구성하는 것이다.   초매개변수 최적화란? 모든 머신러닝 모델에는 매개변수, 즉 모델의 각 변수 또는 특성에 대한 가중치가 있다. 매개변수는 일반적으로 확률...

AutoML 전이학습 초매개변수 특성엔지니어링

2019.08.27

머신러닝(전통적인 머신러닝과 딥러닝 모두) 사용을 가로막는 두 가지 가장 큰 장애물은 기술력과 컴퓨팅 자원이다. 여기서 컴퓨팅 자원 문제는 가속 하드웨어(고성능 GPU를 탑재한 컴퓨터 등)를 구매하거나 클라우드의 컴퓨팅 자원(예를 들어 GPU, TPU, FPGA가 연결된 인스턴스)를 임대하는 방식으로, 즉 돈을 들여서 해결할 수 있다. 그러나 기술력 문제를 해결하기는 어렵다. 데이터 과학자는 인건비가 상당히 비싼 경우가 많고, 그나마도 찾기 힘들다. 구글은 많은 자체 직원들에게 텐서플로우(TensorFlow) 프레임워크를 교육시켰지만, 일반 기업은 교육은 커녕 스스로 머신러닝 및 딥러닝 모델을 구축할 만큼의 기술력 있는 인력도 갖추지 못한 경우가 많다.   AutoML이란? 자동화된 머신러닝, 즉 AutoML은 머신러닝과 딥러닝 모델을 구축하는 데 있어 기술력을 갖춘 데이터 과학자란 필요조건을 제거하는 데 목적을 둔다. AutoML 시스템을 사용하면 레이블링된 학습 데이터를 입력으로 제공하고 최적화된 모델을 출력으로 받을 수 있다. 방법은 두 가지다. 하나는 소프트웨어에서 단순히 데이터에 대해 모든 종류의 모델을 학습시킨 다음 가장 결과가 좋은 모델을 선택하는 방법이다. 이를 개량하는 방법 중 하나는 다른 모델을 결합하는 하나 이상의 앙상블 모델을 만드는 것이다. 이렇게 하면 (항상 그렇지는 않지만) 더 나은 결과를 얻을 수도 있다. 두 번째 방법은 최적 모델의 초매개변수(hyperparameter)를 최적화해서 더 나은 모델을 학습시키는 것이다. 특성 엔지니어링(Feature Engineering)은 모든 모델 학습에서 유용하다. 딥러닝의 탈숙련화 방법 중 하나는 전이 학습(Transfer Learning)을 사용해서 기본적으로 잘 학습된 범용 모델을 특정 데이터에 대해 맞춤 구성하는 것이다.   초매개변수 최적화란? 모든 머신러닝 모델에는 매개변수, 즉 모델의 각 변수 또는 특성에 대한 가중치가 있다. 매개변수는 일반적으로 확률...

2019.08.27

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.31