Offcanvas

AI / 개발자 / 머신러닝|딥러닝

‘하나만 알려줘도 열을 안다’ 생성 AI의 학습 방식, 제로샷·퓨샷 러닝

2023.02.14 Isaac Sacolick  |  InfoWorld
기업은 오랫동안 방대한 데이터를 전처리하는 데만 수많은 시간을 할애해왔다. 최근 챗GPT로 인해 부상한 제로샷(zero-shot), 원샷(one-shot), 퓨샷(few-shot) 러닝 기법은 데이터를 일일이 라벨링하지 않고도 머신러닝 모델을 학습시킬 수 있도록 해준다. 
 
ⓒGetty Images Bank

훗날 2022년은 인지 AI(cognitive AI) 머신러닝 기법이 실험실 밖으로 나와 세상에 모습을 드러낸 해로 기억될 것이다. 대화형 AI 서비스인 챗GPT는 5일 만에 사용자 1백만 명을 끌어모았고, 이미지 생성 AI DALL-E 2, 미드저니(Midjourney) 및 스테이블 디퓨전(Stable Diffusion)은 단지 텍스트 입력만으로 놀라운 이미지를 생성해내며 세상을 놀래켰다. 

스노우플레이크의 제품 관리 총괄 토르스텐 그랩스는 “테슬라나 웨이모의 자율주행 기술, 이세돌을 이긴 알파고 AI에 이어 이제 생성 AI가 세상을 깜짝 놀라게 하고 있다”라고 말했다. 

기존 머신러닝 모델은 지도 학습 기법을 사용했다. 데이터 세트를 라벨링 하여 인공신경망 같은 머신러닝 모델을 학습시키는 방법이다. 예컨대 특정 동물에 대한 이미지 데이터를 고양이, 강아지로 태깅한 다음 CNN(합성곱 신경망)이 동물 종류를 분류할 수 있게끔 지도했다. 

하지만 수많은 양의 데이터를 레이블링 하는 일은 만만치 않다. 의료, 제조 등 산업마다 레이블링해야 하는 데이터가 다를 때는 데이터 전처리 작업만 기하급수적으로 불어난다. 합성 데이터가 도움 되긴 하지만 여전히 지도 학습 모델을 학습시키고 유지하기란 매우 비용이 많이 들어가는 일이다. 
 

데이터 없이도 배운다 

여기서 원샷, 퓨 삿, 제로 샷(one-shot, few-shot, zero-shot) 알고리즘이 빛을 발휘한다. 이런 알고리즘은 모두 입력 데이터가 매우 적거나 혹은 아예 없더라도 관련 작업이나 명령을 수행할 수 있도록 해준다. 

이는 전이학습(transfer learning)이라는 기법 덕분이다. 특정 분야에서 학습된 신경망의 일부를 유사하거나 전혀 새로운 분야에서 재사용하는 것이다. 새로운 분야의 예시나 데이터가 적더라도 인식과 분류가 가능하다. 

존 스노우 랩스의 CTO 데이비드 탈비는 “이름대로 원샷, 퓨샵 학습은 단 몇 가지의 예시만을 활용해 분류 작업을 수행한다. 자연어 몇 단어만 입력해도 텍스트, 문구, 이미지를 분류할 수 있게 해준다”라고 말했다. 

원샷, 퓨샷 러닝은 하나, 혹은 몇 가지 학습 예제만으로도 비슷한 종류의 예제를 판별할 수 있다. 예컨대 신입사원 한 명의 프로필 사진을 한 개만 입력해도 다른 신입사원 프로필 사진과의 유사성을 추산할 수 있다. 

옴니글롯(Omniglot)이 원샷 러닝 연구에 활용되는 대표적인 데이터 세트 중 하나다. 50가지 언어에 걸쳐 문자 총 1,623개가 손글씨로 쓰여 있어 문자의 모양이 모두 다르다. 이런 문자를 한 개만 입력해도 비슷한 문자를 알아맞힐 수 있다면 효과적인 원샷 러닝 모델을 갖추어졌다고 볼 할 수 있다. 

제로 샷 러닝에서는 인공신경망이 먼저 이미지를 비롯한 메타데이터를 학습한다. 하지만 이 과정에서 메타데이터와 이미지는 서로 연결되어 있지 않다. 오픈AI의 CLIP 모델은 이미지의 입체 정보를 데이터로 인코딩해 메타데이터(텍스트 데이터)와 일치시켜 유사도를 측정한다. 이런 학습 과정을 거치면 새 모델은 완전히 새로운 이미지를 보더라도 이를 인지하고 분류할 수 있다. 즉 이미지를 해당 이미지를 묘사하는 텍스트로 바꿀 수 있다. 

오픈AI의 이미지 생성 AI는 DALL-E는 이 과정을 거꾸로 해 텍스트를 이미지로 바꾼다. 
 

나만의 예시로 맞춤화 

퓨샷 러닝의 대표적인 활용 사례는 의료 분야다. 소수의 진단 이미지만으로 각 병원이나 병세에 특화된 분류 모델을 만들 수 있다. 탈비는 “같은 병이라도 병원마다 진단하는 기준이 다르다. 원샷, 퓨샷 러닝을 활용하면 코딩을 하지 않고도 의사 각자 다른 알고리즘을 만들어 진단에 사용할 수 있다”라고 말했다. 

동시에 탈비는 방사선 검사 및 진단이 단기간에 완전히 자동화되기는 힘들 것이라 말했다. 그는 “적은 데이터에서 결론을 뽑아낼 수 있는 AI의 능력은 뛰어나지만 여전히 수십년 간의 공부와 훈련을 거쳐야 하는 의료 전문가를 대체하려면 멀었다”라고 말했다. 

디지털 엔지니어링 및 기업 현대화 업체 퍼시스턴트(Persistent)의 CTO 판두랑 카마트는 “제로, 퓨삿 러닝 기법은 마약 탐지, 분자 연구, 제로데이 취약점 예방, 고객 자동 지원 등 데이터를 미리 학습하기 어려운 활용 사례에서 특히 더 빛을 발휘할 것”이라고 말했다. 

카마트 또한 AI 기술의 한계를 강조했다. 그는 “컴퓨터 비전에서 이미지 식별, 분류, 추적 능력은 뛰어나지만 높은 정확도와 정밀도를 요구하는 환경에서는 아직 역부족이다. 예컨대 암세포를 식별하는 일 말이다”라고 덧붙였다. 

스마트팩토리 솔루션 업체 인더스트리얼ML(Industrial ML)의 CEO 아준 찬달은 불량품 파악에 퓨샷 러닝이 활용될 수 있다고 말했다. 그는 “기존 학습 방식대로라면 방대한 양의 불량품을 AI 모델에 학습시켜야 하는데, 정상적인 공장이 이렇게 많은 불량품을 가지고 있을리 만무하다”라며 “퓨샷 러닝 덕분에 소량의 불량품만으로도 알고리즘을 만들 수 있다”라고 설명했다. ‘’ 
 

모델을 빌려써라  

데이터 과학자는 아직 레이블링 되지 않은 데이터 셋은 분류하는 데 원샷, 제로샷 알고리즘을 활용할 수 있다. AWS 세이지메이커로 경보 시스템을 만들거나 AI 챗봇을 만들어보면서 이런 알고리즘을 경험해볼 수 있다. 

개발자와 데이터 과학자는 새로운 학습 기법과 모델로 새로운 애플리케이션이나 솔루션을 만들어보는 걸 고려해도 좋다. 특정 문제에 최적화된 솔루션을 그대로 가져도 쓰는 것보다 훨씬 더 큰 가능성이 열려있다. 대화형 AI 플랫폼 무브웍스의 엔지니어링 총괄 장 류는 개발자들이 NLP를 직접 개발하기보다 이미 있는 대규모 NLP 모델을 빌려 쓰는 것을 추천한다. 

스노우플레이크 제품 관리 총괄 그랩스는 “조금만 살펴봐도 그럴듯한 AI 솔루션을 만들어낼 수 있는 도구가 널려있다”라고 말했다. 그에 따르면 향후 대다수 AI 솔루션은 자체 모델, 상업용 소프트웨어 그리고 오픈소스 구성요소가 혼합된 형태가 될 전망이다. 
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.