머신러닝(전통적인 머신러닝과 딥러닝 모두) 사용을 가로막는 두 가지 가장 큰 장애물은 기술력과 컴퓨팅 자원이다. 여기서 컴퓨팅 자원 문제는 가속 하드웨어(고성능 GPU를 탑재한 컴퓨터 등)를 구매하거나 클라우드의 컴퓨팅 자원(예를 들어 GPU, TPU, FPGA가 연결된 인스턴스)를 임대하는 방식으로, 즉 돈을 들여서 해결할 수 있다. 그러나 기술력 문제를 해결하기는 어렵다. 데이터 과학자는 인건비가 상당히 비싼 경우가 많고, 그나마도 찾기 힘들다. 구글은 많은 자체 직원들에게 텐서플로우(TensorFlow) 프레임워크를 교육시켰지만, 일반 기업은 교육은 커녕 스스로 머신러닝 및 딥러닝 모델을 구축할 만큼의 기술력 있는 인력도 갖추지 못한 경우가 많다. AutoML이란? 자동화된 머신러닝, 즉 AutoML은 머신러닝과 딥러닝 모델을 구축하는 데 있어 기술력을 갖춘 데이터 과학자란 필요조건을 제거하는 데 목적을 둔다. AutoML 시스템을 사용하면 레이블링된 학습 데이터를 입력으로 제공하고 최적화된 모델을 출력으로 받을 수 있다. 방법은 두 가지다. 하나는 소프트웨어에서 단순히 데이터에 대해 모든 종류의 모델을 학습시킨 다음 가장 결과가 좋은 모델을 선택하는 방법이다. 이를 개량하는 방법 중 하나는 다른 모델을 결합하는 하나 이상의 앙상블 모델을 만드는 것이다. 이렇게 하면 (항상 그렇지는 않지만) 더 나은 결과를 얻을 수도 있다. 두 번째 방법은 최적 모델의 초매개변수(hyperparameter)를 최적화해서 더 나은 모델을 학습시키는 것이다. 특성 엔지니어링(Feature Engineering)은 모든 모델 학습에서 유용하다. 딥러닝의 탈숙련화 방법 중 하나는 전이 학습(Transfer Learning)을 사용해서 기본적으로 잘 학습된 범용 모델을 특정 데이터에 대해 맞춤 구성하는 것이다. 초매개변수 최적화란? 모든 머신러닝 모델에는 매개변수, 즉 모델의 각 변수 또는 특성에 대한 가중치가 있다. 매개변수는 일반적으로 확률...
2019.08.27
머신러닝(전통적인 머신러닝과 딥러닝 모두) 사용을 가로막는 두 가지 가장 큰 장애물은 기술력과 컴퓨팅 자원이다. 여기서 컴퓨팅 자원 문제는 가속 하드웨어(고성능 GPU를 탑재한 컴퓨터 등)를 구매하거나 클라우드의 컴퓨팅 자원(예를 들어 GPU, TPU, FPGA가 연결된 인스턴스)를 임대하는 방식으로, 즉 돈을 들여서 해결할 수 있다. 그러나 기술력 문제를 해결하기는 어렵다. 데이터 과학자는 인건비가 상당히 비싼 경우가 많고, 그나마도 찾기 힘들다. 구글은 많은 자체 직원들에게 텐서플로우(TensorFlow) 프레임워크를 교육시켰지만, 일반 기업은 교육은 커녕 스스로 머신러닝 및 딥러닝 모델을 구축할 만큼의 기술력 있는 인력도 갖추지 못한 경우가 많다. AutoML이란? 자동화된 머신러닝, 즉 AutoML은 머신러닝과 딥러닝 모델을 구축하는 데 있어 기술력을 갖춘 데이터 과학자란 필요조건을 제거하는 데 목적을 둔다. AutoML 시스템을 사용하면 레이블링된 학습 데이터를 입력으로 제공하고 최적화된 모델을 출력으로 받을 수 있다. 방법은 두 가지다. 하나는 소프트웨어에서 단순히 데이터에 대해 모든 종류의 모델을 학습시킨 다음 가장 결과가 좋은 모델을 선택하는 방법이다. 이를 개량하는 방법 중 하나는 다른 모델을 결합하는 하나 이상의 앙상블 모델을 만드는 것이다. 이렇게 하면 (항상 그렇지는 않지만) 더 나은 결과를 얻을 수도 있다. 두 번째 방법은 최적 모델의 초매개변수(hyperparameter)를 최적화해서 더 나은 모델을 학습시키는 것이다. 특성 엔지니어링(Feature Engineering)은 모든 모델 학습에서 유용하다. 딥러닝의 탈숙련화 방법 중 하나는 전이 학습(Transfer Learning)을 사용해서 기본적으로 잘 학습된 범용 모델을 특정 데이터에 대해 맞춤 구성하는 것이다. 초매개변수 최적화란? 모든 머신러닝 모델에는 매개변수, 즉 모델의 각 변수 또는 특성에 대한 가중치가 있다. 매개변수는 일반적으로 확률...
2019.08.27