Offcanvas

AI / 머신러닝|딥러닝

오픈AI, 음성 복제 기술 ‘보이스 엔진’ 발표··· 교육,의료,공공 활용 사례 공개

2024.04.01 이지현  |  CIO KR
오픈AI가 15초 길이의 샘플 목소리 파일로 음성을 복제하는 AI 모델 ‘보이스 엔진’을 3월 29일 공개했다.
 
ⓒ 오픈AI

보이스 엔진은 음성 샘플을 활용해 특정 화자의 억양, 말투, 감정 등을 반영해 음성을 합성해 주는 기술이다. 현재 보이스 엔진은 프리뷰 형태로 제한된 파트너사만 활용할 수 있다. 오픈AI는 “음성 합성 기술이 잘못 활용될 가능성이 있기 때문에 일반 사용자를 위한 대규모 출시는 보다 신중하게 고려해서 진행할 것”이라고 밝혔다.

오픈AI는 보이스 엔진의 가능성을 보여주기 위해 구체적인 활용 사례를 공개했다. 여기에는 교육, 공공, 의료 분야 사례가 포함됐다.

먼저 교육 기업 에이지오브러닝은 보이스 엔진을 통해 다양한 목소리와 외국어로 교육 콘텐츠를 제작하고 있다. 과학, 수학, 언어 과목에 필요한 해설 및 맞춤형 교육 콘텐츠를 보이스 엔진으로 보다 편리하게 만들고 있다고 한다. AI 영상 생성 도구를 내놓고 있는 헤이젠은 보이스 엔진을 활용해 영상 콘텐츠를 다국어로 번역하는 서비스를 선보였다.

비영리 의교 기관인 라이프스팬은 뇌종양 수술 등으로 돌발성 혹은 퇴행성 언어 질환을 겪는 환자를 치료하기 위한 음성을 보이스 엔진으로 생성하고 있다. 리복스라는 기관도 의사소통에 어려움 겪는 환자 및 장애인을 위한 기술을 만드는 과정에서 보이스 엔진으로 목소리를 생성하고 있다.

개발도상국 지역 주민의 보건 상담을 지원하는 디마지는 현지 언어로 제작한 음성 교육 자료를 보이스 엔진을 통해 생성하고 있다. 여기에느 스와힐리어, 쉥 언어 등 소수민족 언어 기반 음성 자료도 있다. 디마지는 이런 기술로 현지 직원의 업무 부담을 줄이는 동시에 보다 다양한 지역 주민에게 의료 상담을 제공하고 있다고 한다.

오픈AI는 블로그를 통해 “사람의 목소리와 유사한 음성을 생성하는 것은 심각한 위험을 수반하며, 특히 선거가 있는 해에는 더욱 주의해야 한다”라며 “오픈AI는 정부, 미디어, 엔터테인먼트, 교육, 시민 사회 등 다양한 분야의 미국 및 국제 파트너와 협력하고 피드백을 받아 음성 엔진을 구축하고 있다”라고 설명했다.

오픈AI 파트너사는 보이스 엔진을 이용하기 위해 동의나 법적 권리 없이 다른 개인이나 단체를 사칭하는 것을 금지하는 사용 정책에 동의해야 한다. 또한 오픈AI 파트너사는 워터마크 등으로 생성된 음성이 AI가 만든 음성임을 명확히 밝히고 있다.
jihyun_lee@idg.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
Sponsored
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.