2020.12.08

엔비디아, 제한된 데이터세트로 AI 학습시키는 기술 발표

강옥주 | CIO KR
엔비디아 리서치(NVIDIA Research)가 지난 7일(현지 시각) 신경정보처리시스템학회(NeurIPS)에서 제한된 데이터세트만으로도 AI를 학습시킬 수 있는 방법을 개발했다고 발표했다

생성적 적대 신경망(Generative Adversarial Network, GAN)은 생성자(Generator)와 판별자(Discriminator)가 서로 경쟁(Adversarial)하면서 상호 성능을 개선해 나가는 머신러닝 알고리즘이다. 
 
ⓒNVIDIA Research

대부분의 AI 알고리즘과 마찬가지로 GAN 역시 학습 데이터가 많을수록 더 나은 성능의 모델이 만들어진다. 엔비디아 리서치에 따르면 GAN이 신뢰할 수 있는 결과를 도출하도록 학습시키려면 일반적으로 5~10만 개의 학습 데이터가 필요했다. 학습 데이터가 너무 적으면 학습 데이터에선 최적의 결과를 내지만 학습되지 않은 새 데이터에서는 결과가 부정확해지는 과적합(Overfitting) 문제가 생기기 때문이다. 

그래서 이에 관한 대안으로 회전, 크롭, 뒤집기 등 기존 이미지를 변형한 복사본을 활용하는 데이터 증강(data augmentation)이 사용되기도 했다. 하지만 이 또한 AI 모델이 신뢰할 수 있는 합성 이미지를 생성하는 대신 이러한 변형을 모방하는 방법을 배울 수 있다는 문제가 있었다고 엔비디아 리서치는 설명했다. 

이번에 엔비디아 리서치가 공개한 '적응형 판별자 증강(Adaptive Discriminator Augmentation, ADA)'는 여전히 데이터 증강을 사용하지만 적응적으로 적용한다는 게 연구진 측 설명이다. 다시 말해, 전체 학습 과정의 여러 지점에서 데이터 증강이 조정돼 적용된다는 것이다. 이를 통해 엔비디아 스타일GAN2(StyleGAN2) 같은 모델은 훨씬 적은 학습 이미지로도 동일한 결과를 얻을 수 있었다고 엔비디아 리서치는 밝혔다. 

한편 엔비디아 리서치는 엔비디아 스타일GAN2(StyleGAN2) 모델에 이 학습 기술을 적용해 메트로폴리탄 미술관의 1,500여개 이미지를 기반으로 예술 작품을 새롭게 생성해냈다. 역사적인 초상화에서 영감을 받은 새로운 AI 예술작품을 만들어낸 것이다. 

연구진은 "데이터가 너무 적거나, 데이터를 확보하기 어렵거나, 혹은 대규모 데이터세트를 수집하기에는 너무 많은 시간이 소요되는 사례에 이 학습 기술을 적용할 수 있다"라면서, "훌륭한 결과를 얻을 수 있는 동시에 학습 데이터의 수를 10~20배가량 줄일 수 있다"라고 전했다.


ciokr@idg.co.kr
 



2020.12.08

엔비디아, 제한된 데이터세트로 AI 학습시키는 기술 발표

강옥주 | CIO KR
엔비디아 리서치(NVIDIA Research)가 지난 7일(현지 시각) 신경정보처리시스템학회(NeurIPS)에서 제한된 데이터세트만으로도 AI를 학습시킬 수 있는 방법을 개발했다고 발표했다

생성적 적대 신경망(Generative Adversarial Network, GAN)은 생성자(Generator)와 판별자(Discriminator)가 서로 경쟁(Adversarial)하면서 상호 성능을 개선해 나가는 머신러닝 알고리즘이다. 
 
ⓒNVIDIA Research

대부분의 AI 알고리즘과 마찬가지로 GAN 역시 학습 데이터가 많을수록 더 나은 성능의 모델이 만들어진다. 엔비디아 리서치에 따르면 GAN이 신뢰할 수 있는 결과를 도출하도록 학습시키려면 일반적으로 5~10만 개의 학습 데이터가 필요했다. 학습 데이터가 너무 적으면 학습 데이터에선 최적의 결과를 내지만 학습되지 않은 새 데이터에서는 결과가 부정확해지는 과적합(Overfitting) 문제가 생기기 때문이다. 

그래서 이에 관한 대안으로 회전, 크롭, 뒤집기 등 기존 이미지를 변형한 복사본을 활용하는 데이터 증강(data augmentation)이 사용되기도 했다. 하지만 이 또한 AI 모델이 신뢰할 수 있는 합성 이미지를 생성하는 대신 이러한 변형을 모방하는 방법을 배울 수 있다는 문제가 있었다고 엔비디아 리서치는 설명했다. 

이번에 엔비디아 리서치가 공개한 '적응형 판별자 증강(Adaptive Discriminator Augmentation, ADA)'는 여전히 데이터 증강을 사용하지만 적응적으로 적용한다는 게 연구진 측 설명이다. 다시 말해, 전체 학습 과정의 여러 지점에서 데이터 증강이 조정돼 적용된다는 것이다. 이를 통해 엔비디아 스타일GAN2(StyleGAN2) 같은 모델은 훨씬 적은 학습 이미지로도 동일한 결과를 얻을 수 있었다고 엔비디아 리서치는 밝혔다. 

한편 엔비디아 리서치는 엔비디아 스타일GAN2(StyleGAN2) 모델에 이 학습 기술을 적용해 메트로폴리탄 미술관의 1,500여개 이미지를 기반으로 예술 작품을 새롭게 생성해냈다. 역사적인 초상화에서 영감을 받은 새로운 AI 예술작품을 만들어낸 것이다. 

연구진은 "데이터가 너무 적거나, 데이터를 확보하기 어렵거나, 혹은 대규모 데이터세트를 수집하기에는 너무 많은 시간이 소요되는 사례에 이 학습 기술을 적용할 수 있다"라면서, "훌륭한 결과를 얻을 수 있는 동시에 학습 데이터의 수를 10~20배가량 줄일 수 있다"라고 전했다.


ciokr@idg.co.kr
 

X