Offcanvas

AI / 로봇|자동화 / 머신러닝|딥러닝 / 신기술|미래 / 인문학|교양

메타, 제너레이티브 AI '메이크 어 비디오' 공개

2022.10.05 김달훈  |  CIO KR
"일몰, 고해상도의 아름다운 열대 해변에서 아이스크림을 먹는 골든 리트리버", "하늘을 나는 빨간 망토와 슈퍼 히어로 복장을 한 개", "초상화를 그리는 테디베어". 무엇을 상상하든, 그 상상을 텍스트로 입력하면, 동영상 클립으로 만들어준다. 메타가 새롭게 선보인 동영상 제너레이티브(Generative) AI 이야기다.

메타가 텍스트를 입력하면 동영상 클립을 생성하는 메이크 어 비디오(Make a Video)를 공개했다. 최근 들어 텍스트 입력을 기반으로 이미지를 생성하는 텍스트-이미지 생성 AI가 봇물처럼 등장하는 가운데, 이제는 한발 더 나아가 동영상까지 생성할 수 있는 인공 지능으로 발전한 것이다. 아직은 영상 품질이 떨어지고 불과 몇 초 정도의 동영상 클립만 만들 수 있지만, 다음 단계로 진화하는 제너레이티브 AI의 모습을 기대하기에 충분하다.


메타가 공개한 '메이크 어 비디오'를 이용하면 텍스트로 입력한 단어나 문장을 기반으로 인공지능을 통해 짧은 동영상 클립을 만들 수 있다. (자료 : Meta)

달·이(DALL·E), 이매젠(Imagen), 미드저니(Midjourney) 등 텍스트를 입력하면 이를 기반으로 이미지를 생성하는 인공지능은, 이제 재미 삼아 보는 체험 수준을 넘어 실제 활용이 가능할 만큼 빠르게 발전하고 있다. 또한 다양한 기업이나 기관에서 텍스트-이미지 생성 AI를 앞다퉈 내놓으며 치열한 경쟁을 벌이고 있다. 급기야 인공지능이 생성한 이미지로 인한 저작권 문제나 예술 작품으로 볼 것인지에 대한 논쟁이 커지고 있다.

이런 상황에서 메타가 메이크 어 비디오를 선보이면서, 이제는 텍스트-비디오 생성 분야까지 경쟁 구도가 넓어질 전망이다. 메이크 어 비디오는 텍스트-이미지 생성 기술을 한 단계 발전시켜, 공개된 데이터를 학습한 후 이를 기반으로 동영상 클립을 생성한다. 몇 개의 단어를 조합하거나 문장을 입력하면, 이를 분석해 사진이 아닌 영상을 만드는 것이다.

예를 들어 "리모컨을 들고 TV를 보는 고양이'를 입력하면, 리모컨을 들고 채널을 돌리는 고양이 영상을 만든다. 달·이(DALL·E), 이매젠(Imagen), 미드저니(Midjourney) 같은 텍스트-이미지 생성 AI가 '사진' 한 장이나 비슷한 분위기 사진 몇 장을 만들어 내는 것과 비교하면 분위기나 느낌부터가 다르다.

메이크 어 비디오는 이미지를 기반으로 이를 동영상 클립으로 만들거나, 원본 비디오를 활용해 창의적으로 변형된 새로운 동영상을 만드는 것도 가능하다. 예를 들면 거친 파도를 나아가는 배가 그려진 이미지를 사용해, 높은 파도를 뚫고 나아가는 배를 동영상 클립으로 만들 수 있다. 또한 두 장의 사진을 입력 받아 중간 단계의 움직임을 추측한 영상 클립을 제작한다.

동영상 변형은 입력 소스를 기반으로 배경을 바꾸거나 움직임 또는 포즈 등을 변경한 영상 클립을 생성한다. 메타는 이번에 공개한 메이크 어 비디오를 이전 기술과 비교하면, 텍스트 입력 표현과 영상 품질이 각각 3배 향상되었다고 밝혔다. 메이크 어 비디오로 생성된 비디오 클립에는 메타 로고와 이름이 들어간 워터마크를 추가해, AI를 통해 생성된 것임을 표시한다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.