Offcanvas

AI / 마케팅 / 신기술|미래 / 애플리케이션

낮아지는 제작 문턱··· 업무용 'AI 합성 콘텐츠'가 온다

2024.01.25 Matthew Finnegan  |  Computerworld
새로운 AI 기반 도구 덕분에 각종 언어로 마케팅 또는 교육용 비디오 프레젠테이션을 쉽게 제작할 수 있는 환경이 펼쳐지고 있다. 이제 기업들은 비즈니스 분야에 나타날 합성 미디어의 물결에 대비해야 한다.



악의적인 목적으로 제작되거나 조작된 온라인 콘텐츠인 딥페이크 동영상을 우려하는 목소리가 높다. 선거가 다가옴에 따라 더욱 그렇다. 그러나 디지털 '합성 미디어'는 기업에게 실제적인 이점을 제공할 수도 있다.

생성형 AI(genAI) 도구와 딥러닝 알고리즘으로 무장한 다양한 스타트업이 이러한 가능성을 제시하고 있다. 기업은 이들 도구를 사용함으로써 사내 커뮤니케이션, 직원 교육용 동영상, 특정 직업이나 업무에 대한 매뉴얼, 심지어 고객 대상 마케팅 동영상까지 제작할 수 있다.

가령 디지털 아바타는 제작 및 편집 비용과 노력 없이도 동영상 콘텐츠에 사용될 수 있다. 그 결과 콘텐츠 제작 속도가 빨라지고, 개인화 기능이 향상된다. 아울러 성우를 고용하지 않고도 다양한 언어로 메시지를 번역할 수 있으며, 동시에 직원과 고객에게 유용한 정보를 전달할 수 있게 됐다.

IDC의 AI 부문 그룹 부사장인 리투 조티는 비즈니스 맥락에서 AI 기반 비디오 제작 도구의 "엄청난 잠재력을 보고 있다. 기업들은 마케팅, 교육, 훈련, 비디오 매뉴얼 제작에 이 도구를 사용할 것"이라고 말했다.

오늘날 대부분의 경우 인공 동영상임이 드러난다. 하지만 기업 커뮤니케이션에 적합할 정도로 충분히 현실감 있게 발전한 것도 사실이다. 조티는 합성 아바타에 대해 "매우 사실적으로 보인다. 이제 눈을 깜빡이고, 뺨을 움직이고, 입술을 움직일 수 있다"라고 전했다.

최근 몇 년 동안 기업이 직원의 실제와 같은 디지털 아바타를 만들 수 있도록 도와주는 스타트업이 많이 등장했다. 지난 2년 동안 1억 5,600만 달러의 투자를 유치한 신디시아(Synthesia), D-ID, 헤이젠(HeyGen), 아워 원(Hour One) 등이 그 예이다. 또 다른 회사인 리프레이즈.ai(Rephrase.ai)는 최근 한 주요 기술 기업(어도비로 알려짐)에 인수됐다.

큰 규모의 기업들도 비슷한 기능을 개발하고 있다. 마이크로소프트는 11월에 했으며, 현재 프리뷰 상태다.


마이크로소프트의 애저 AI 스피치는 합성 아바타를 만드는 데 사용할 수 있다.

포레스터의 수석 애널리스트인 로완 커런은 "대형 벤더와 스타트업 양쪽에서 이 시장이 계속 성장할 것"이라고 전망했다. 하지만 적어도 기업 측면에서 볼 때 시장은 초기 단계에 있다며 그는 "실제 기능보다는 채택률 측면에서 더 그렇다"라고 말했다.

텍스트 문서를 대체하는 비디오?
대부분의 애플리케이션에서 AI 생성 콘텐츠를 만드는 기본 프로세스는 간단하다. 사용자는 일반적으로 기성 옵션의 아바타를 선택하거나 직원의 비디오 영상(또는 경우에 따라서는 이미지)을 업로드하여 디지털 표현물을 생성한다. 이후 음성을 선택한 다음 텍스트 스크립트를 추가하고 배경과 같은 다른 사용자 지정 요소도 지정하기도 한다.

모든 요소가 준비되면 동영상이 생성되며, 파워포인트 프레젠테이션 등에서 이용할 수 있다. 

신디시아의 CEO이자 공동 설립자인 빅터 리파벨리는 비즈니스에 있어 가장 큰 장점은 비용 절감이라고 말했다. (이 회사의 고객사에는 하이네켄, 줌, 듀폰과 같은 다국적 기업이 포함된다.) 그는 "비디오 제작팀을 고용하는 데 드는 비용과 장비 및 스튜디오 시간 등의 비용이 절감된다. 오늘날 많은 조직에서 비용 문제로 인해 비디오를 제작하지 못한다"라고 말했다.

또 동영상 제작에 필요한 시간을 단축할 수 있고, 재촬영 없이도 변경 사항을 적용할 수 있다고 그는 덧붙였다. 아울러 이러한 도구를 사용하면 비디오 제작 노하우 없이도 조직 내에서 더 많은 직원이 비디오를 제작할 수 있다.


신디시아의 CEO 빅터 리파벨리는 합성 미디어가 제작 비용 절감에 도움이 될 수 있다고 말했다. 

리파벨리는 마케팅 콘텐츠를 제외하고 현재 기업에서 가장 많이 사용하는 용도는 학습 및 개발 콘텐츠 제작이며, 온보딩 및 채용 동영상도 일반적인 활용 사례라고 전했다. 

포춘 500대 기업을 고객사로 두고 있는 D-ID의 매튜 커쇼 부사장은 생성형 AI 기반 플랫폼을 통해 제작된 동영상이 직원 학습 및 개발 등의 목적으로 기존 오피스 문서를 대체하는 경우가 많다고 설명했다. 그는 "예전에는 이러한 콘텐츠가 주로 PPT 문서로 제작됐다. 이제는 이러한 콘텐츠를 동영상으로 제작할 수 있도록 지원할 수 있다"라고 말했다. 그에 따르면 사람들은 서면 문서나 슬라이드를 읽는 것보다 동영상을 시청할 가능성이 더 높으며, 나중에 해당 정보를 기억할 가능성도 더 높다.


생성형 AI 기반 도구로 제작된 동영상이 향후 파워포인트 슬라이드와 같은 기존 오피스 문서를 대체할 수 있다.

D-ID는 동영상 외에도 기업 고객 또는 사내 직원 사이의 준실시간 상호작용을 위한 AI 아바타 영역에도 주력하고 있다. 이 아이디어는 합성 미디어와 AI의 콘텐츠 생성을 결합하여 아바타를 대규모 언어 모델(LLM) 기반 챗봇의 '얼굴'로 만드는 것이라고 커쇼는 전했다.

그는 "실시간으로 대화하고 질문할 수 있는 디지털 인간 아바타를 만들 수 있다. LLM만으로는 매우 제한적이다. 텍스트를 입력하면 텍스트를 돌려받을 뿐이다. 우리는 훨씬 더 자연스러운 인간적인 방식으로 대화할 수 있는 기능을 갖추고 있다"라고 말했다.

그는 이어 언젠가는 감정 분석 기능을 추가하여 대화의 감정적 흐름을 추적할 수 있기를 기대한다고 설명했다. “예를 들어 고객 서비스 업무와 관련하여 고객이 좌절하거나 화를 내는 경우, 아바타가 이를 인식하고 '상당히 좌절하신 것 같네요'라고 말할 수 있을 것이다”라고 말했다. 이 밖에 직원 안내서 문서를 참조할 필요 없이 아바타에게 회사 규정과 관련된 질문, 예를 들어 배심원으로 선정될 때의 지침을 물어보는 시나리오도 가능하다고 그는 덧붙였다. 

AI 아바타 사용 시 주의해야 할 사항
애널리스트들은 다른 생성형 AI 도구를 사용할 때와 마찬가지로, 기업이 AI 비디오 제작 도구를 배포할 때 보안 및 거버넌스와 관련된 예방 조치를 취해야 한다고 조언했다. 커란은 "이러한 애플리케이션의 사용을 고려하는 기업은 엄격한 테스트와 위험 평가를 수행해야 한다. 여기에는 직원들이 도구에 어떻게 반응하는지 파악하기 위한 사용자 수용성 테스트가 포함되어야 한다”라고 말했다.

조티는 AI 동영상 제작 도구의 결과물에도 주의를 기울여야 한다고 지적했다. 챗GPT와 같은 텍스트 기반 도구가 '환각'을 일으킬 수 있는 것처럼, 아바타의 대화가 스크립트 입력과 다를 수 있다. 이는 특히 텍스트가 여러 언어로 번역될 때 문제가 될 수 있다. 조티는 기업에서 콘텐츠 필터링을 통해 환각과 유해한 결과물을 완화할 수 있도록 해야 한다고 강조했다.

또한 아바타가 메시지의 의도된 어조와 일치하도록 제어할 수 있는지 확인하는 것도 중요하다. 조티는 "먼저 아바타를 테스트하고, 실험해보고, 더 간단하고 덜 위험한 사용 사례에 아바타를 사용해야 할 것”이라고 말했다.

한편 아바타를 사용하면 데이터 소유권에 대한 질문이 제기될 수 있다. 예를 들어, AI 기반 비디오 제작 도구를 사용함에 있어 직원이 퇴사한 후에도 해당 직원의 모습을 기반으로 비디오 콘텐츠를 계속 제작하는 경우가 있을 수 있다. 커런은 "이미 일부 고용 계약서에 명시된 경우도 있지만, 회색지대가 더 늘어날 것"이라고 말했다. 

이러한 도구가 딥페이크나 무단 콘텐츠 제작에 악용될 수 있다는 우려가 존재하는 가운데, 공급업체들은 이를 방지하기 위한 조치를 취하고 있다. 예를 들어, 커쇼는 D-ID의 소프트웨어를 사용하여 제작된 동영상에는 해당 동영상이 ‘진짜’임을 나타내는 로고(D-ID 자체 또는 고객의 로고) 또는 면책 조항이 포함된다고 설명했다.

합성 미디어가 범람할까?
AI 비디오 생성 도구는 어떤 면에서 2022년 말부터 시작된 AI 물결의 다음 단계일 수 있다. 초기 도구는 텍스트 생성에 중점을 뒀지만 앞으로는 달라질 수 있는 셈이다. 커런은 2024년 중 텍스트 생성 대신 이미지와 비디오 생성에 이목이 집중될 것으로 전망했다.

음성 및 오디오 생성 기술도 다른 한편에서 활발히 개발되고 있다. 이러한 기술이 결합되면 기업과 인터넷에서 생성되는 콘텐츠의 양이 크게 늘어날 수 있다. 커런은 곧 기업 채널의 수요를 실제로 충족할 수 있는 속도로 콘텐츠가 만들어질 수도 있다고 기대했다.

그렇다고 해서 생성형 AI가 조만간 인간의 콘텐츠 작업을 대체할 것이라는 의미는 아니다. 예를 들어, 조직 내 위기 상황에서 CEO가 직원들에게 연설하는 것과 같이 인간적인 소통에는 AI로 생성된 콘텐츠가 적합하지 않을 수 있다.

커쇼는 D-ID와 같은 도구의 핵심은 모든 시나리오에서 비디오 제작을 대체하는 것이 아니라 이전에는 불가능했던 비디오 제작을 가능하게 하는 것이라고 말했다. 

"현실적으로 실제 비디오로 할 수 있는 일과 AI로 할 수 없는 일이 있다. 따라서 비디오 제작은 앞으로도 존재할 것이다. AI를 통해 할 수 있는 일은 더 많은 곳에 비디오를 배치하는 것이다. 평소에는 비디오를 배치할 수 없었던 곳에 비디오를 배치하는 것이다라고 그는 말했다.

그는 과거의 흑백 인쇄물을 예로 들었다. 커쇼는 "이제 흑백 인쇄물은 거의 찾아볼 수 없고 모든 것이 컬러로 되어 있다. 비디오도 비슷한 상황이 벌어질 것입니다. 비디오가 비즈니스 커뮤니케이션의 표준이 될 것이다"라고 말했다. ciokr@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.