2021.01.06

없으면 만든다··· 오픈 AI, 진일보한 이미지 생성 AI '달·E' 선보여

박예신 | CIO
일론 머스크가 설립한 인공지능 전문기업 오픈 AI가 텍스트를 인식해 이미지를 생성하는 인공 신경망 달·E(DALL·E)를 5일(현지시간) 웹사이트를 통해 공개했다. 주목할 만한 특징은 ‘엉뚱한 텍스트’를 입력해도 그에 대응하는 이미지를 ‘창조’하는 역량을 가졌다는 점이다. 

달·E는 오픈 AI가 지난해 10월 공개한 딥러닝 기반 자연어 처리 모델인 GPT-3의 신경망을 기반으로 만든 AI다. 단 크게 달라진 점이 있다. 오픈 AI는 부자연스럽거나 독특한 내용의 텍스트를 입력해도 그에 걸맞는 이미지를 생성할 수 있다고 강조했다. 

회사는 “동물이나 사물을 의인화된 이미지로 표현하고, 관련성이 떨어지는 두 사물을 그럴 듯하게 합성한다. 기존의 이미지에 변형을 가하기도 한다. 달.E는 텍스트를 폭넓게 이해해 이미지를 생성하는 역량을 갖췄음이 확인됐다”라고 전했다.
 
ⓒOpen AI

예컨대, ‘가죽재킷을 입고 강아지와 산책하는 일본식 아기 무’(An illistration of a baby daikon radish in a leather jacket walking a dog) 혹은 ‘아보카도 모양의 커피테이블’(A coffee table in the shape of a avocado)과 같은 엉뚱한 내용의 텍스트도 인식해 수십 장의 이미지를 만들어낼 수 있다는 게 오픈 AI 측의 주장이다. 

오픈 AI는 달·E가 유명 인물을 대머리 이미지로 표현하거나, 원형 이미지를 비트는 등의 작업을 수행한 내용을 웹사이트에 공개하기도 했다. 

이에 앞서 오픈 AI는 딥러닝 기반 언어처리 모델인 GPT-3를 발표한 바 있다. 데이터세트 3,000억 개를 사전 학습한 GPT-3는 시 작성부터 웹페이지 제작, 코딩, 디자인 등 여러 작업을 인간과 유사한 수준으로 구현하며 지난해 관심을 모은 바 있다. 이후 오픈 AI는 GPT-3의 신경망을 활용해 이미지 GPT(Image GPT)를 만들어 선보이기도 했다. 이미지 GPT는 이미지의 일부만 입력해도 완성된 이미지를 출력할 수 있다.

한편 오픈 AI는 지난 2015년 비영리 인공지능 연구소로 처음 설립됐다. 일론 머스크 등 주요 IT 기업 및 벤처캐피털 인사들이 공동 설립했다. 2019년에는 컴퓨팅과 인재에 대한 투자를 늘리겠다며 제한적 영리 활동을 추구하는 (Capped-profit) 법인인 오픈 AI LP를 설립하기도 했다. ciokr@idg.co.kr



2021.01.06

없으면 만든다··· 오픈 AI, 진일보한 이미지 생성 AI '달·E' 선보여

박예신 | CIO
일론 머스크가 설립한 인공지능 전문기업 오픈 AI가 텍스트를 인식해 이미지를 생성하는 인공 신경망 달·E(DALL·E)를 5일(현지시간) 웹사이트를 통해 공개했다. 주목할 만한 특징은 ‘엉뚱한 텍스트’를 입력해도 그에 대응하는 이미지를 ‘창조’하는 역량을 가졌다는 점이다. 

달·E는 오픈 AI가 지난해 10월 공개한 딥러닝 기반 자연어 처리 모델인 GPT-3의 신경망을 기반으로 만든 AI다. 단 크게 달라진 점이 있다. 오픈 AI는 부자연스럽거나 독특한 내용의 텍스트를 입력해도 그에 걸맞는 이미지를 생성할 수 있다고 강조했다. 

회사는 “동물이나 사물을 의인화된 이미지로 표현하고, 관련성이 떨어지는 두 사물을 그럴 듯하게 합성한다. 기존의 이미지에 변형을 가하기도 한다. 달.E는 텍스트를 폭넓게 이해해 이미지를 생성하는 역량을 갖췄음이 확인됐다”라고 전했다.
 
ⓒOpen AI

예컨대, ‘가죽재킷을 입고 강아지와 산책하는 일본식 아기 무’(An illistration of a baby daikon radish in a leather jacket walking a dog) 혹은 ‘아보카도 모양의 커피테이블’(A coffee table in the shape of a avocado)과 같은 엉뚱한 내용의 텍스트도 인식해 수십 장의 이미지를 만들어낼 수 있다는 게 오픈 AI 측의 주장이다. 

오픈 AI는 달·E가 유명 인물을 대머리 이미지로 표현하거나, 원형 이미지를 비트는 등의 작업을 수행한 내용을 웹사이트에 공개하기도 했다. 

이에 앞서 오픈 AI는 딥러닝 기반 언어처리 모델인 GPT-3를 발표한 바 있다. 데이터세트 3,000억 개를 사전 학습한 GPT-3는 시 작성부터 웹페이지 제작, 코딩, 디자인 등 여러 작업을 인간과 유사한 수준으로 구현하며 지난해 관심을 모은 바 있다. 이후 오픈 AI는 GPT-3의 신경망을 활용해 이미지 GPT(Image GPT)를 만들어 선보이기도 했다. 이미지 GPT는 이미지의 일부만 입력해도 완성된 이미지를 출력할 수 있다.

한편 오픈 AI는 지난 2015년 비영리 인공지능 연구소로 처음 설립됐다. 일론 머스크 등 주요 IT 기업 및 벤처캐피털 인사들이 공동 설립했다. 2019년에는 컴퓨팅과 인재에 대한 투자를 늘리겠다며 제한적 영리 활동을 추구하는 (Capped-profit) 법인인 오픈 AI LP를 설립하기도 했다. ciokr@idg.co.kr

X