Offcanvas

AI / 머신러닝|딥러닝

챗GPT 비디오 버전 나오나··· 오픈AI, 영상 생성 AI 모델 ‘소라’ 공개

2024.02.16 이지현  |  CIO KR
오픈AI가 텍스트를 입력하면 비디오를 생성하는 AI 모델 ‘소라(Sora)’를 15일 공개했다.
 
소라 모델이 생성한 영상 예시 ⓒ 오픈AI

소라를 이용해 영상을 만드는 방식은 간단한다. 챗GPT를 이용하듯이 원하는 비디오의 내용을 묘사하면, 최대 1분 길이의 영상이 생성된다. 영상 내용은 실제 현실에 있는 도시, 인물, 배경부터 반영할 수 있으며, 아예 존재하지 않은 가상 세계를 출력할 수 있다. 여기에 드론으로 찍은 각도, 클로즈업을 적용해 달라는 식으로 촬영 기법도 원하는 대로 요청하거나 화질 품질 수준도 맞춤 출력할 수 있다. 단 현재 공개된 예시 영상 내 소리는 없는 상태다.

오픈AI는 “기술적으로 소라는 GPT와 달리(DALL·E) 모델을 활용해 개발됐다”라며 “소라는 실제 세계를 이해하고 시뮬레이션할 수 있는 모델의 기반이 될 것이며, 이는 AGI를 실현하는 데 중요한 이정표가 될 것”이라고 설명했다.

오픈AI가 소개한 예시에 따르면, 프롬프트에 ‘다양한 스타일의 아름다운 예술 작품이 가득한 미술관을 둘러보다’, ‘뉴욕시가 아틀란티스처럼 물에 잠겼다. 물고기, 고래, 바다거북, 상어가 뉴욕의 거리를 헤엄친다’, ‘눈 속에서 놀고 있는 골든 리트리버 강아지 무리. 강아지들의 머리가 눈 속에서 나온다’, ‘교외 주택의 창턱에서 자라는 꽃의 스톱 모션 애니메이션’을 입력하면 관련 영상이 출력된다. 구체적인 예시는 공식 블로그를 통해 볼 수 있다.

오픈AI는 소라가 아직 초기 단계로 피드백을 받아서 개선하겠다고 밝혔다. 단점도 미리 공개했다. 오픈AI는 “현재 소라 모델은 복잡한 장면의 물리학을 정확하게 시뮬레이션하는 데 어려움을 겪을 수 있으며, 원인과 결과의 특정 사례를 이해하지 못할 수도 있다”라며 “예를 들어, 영상 내 사람이 쿠키를 한 입 베어 물었을 때 쿠키 자체에 베어 먹은 자국이 없을 수 있다”라고 설명했다.

오픈AI는 소라가 부적절한 콘텐츠 제작에 활용되지 않도록 지원할 것이라는 입장도 밝혔다. 오픈AI는 “우리 텍스트 분류기는 극단적인 폭력, 성적 콘텐츠, 혐오 이미지, 유명인 초상화, 타인의 IP를 요청하는 등 사용 정책에 위배되는 텍스트 입력값을 확인하면 출력을 거부할 수 있다”라며 “생성된 동영상의 프레임을 검토하여 사용자에게 노출되기 전에 사용 정책을 준수하는지 확인하는 이미지 분류기를 따로 개발했다”라고 밝혔다.

소라는 아직 일반 사용자에게 공개되지 않았다. 시각 예술가, 디자이너, 영화 제작자 등 오픈AI가 선별한 일부 사용자에게만 접근 권한이 제공되고 있다.
jihyun_lee@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.