Offcanvas

AI / 소비자IT / 애플리케이션

메타, AI 이용한 오디오 압축 기술 발표“MP3의 10배 압축률”

2022.11.04 Manfred Bremmer  |  COMPUTERWOCHE
페이스북과 왓츠앱의 모회사 메타가 AI 기반의 오디오 압축 기술 ‘엔코덱(EnCodec)’을 발표했다. 이 기술은 오디오 데이터를 64kbps MP3 형식보다 10배 더 작은 파일로 압축하면서도 음질 손실이 없는 것이 특징이다. 

발표에 따르면, 이 기술은 신호가 약한 지역에서의 음성 통화처럼 대역폭이 낮은 접속 환경에서 음성 품질을 확연히 개선할 수 있다. 음악 데이터에도 적용할 수 있기 때문에 향후 MP3를 대체할 잠재력도 있다. 메타는 오디오 샘플을 사용해 서로 다른 압축 기술 간의 차이를 시연하기도 했다.

엔코덱에 대한 자세한 내용은 메타의 AI 연구원 알렉산드레 디포세스, 제이드 코펫, 가브리엘 사이나브, 요시 아디가 공동 작성한 보고서 “High Fidelity Neural Audio Compression”에서 볼 수 있다.
 
ⓒ MetaAI

엔코덱 블로그의 요약 설명에 따르면, 새 기술은 오디오를 원하는 크기로 압축하도록 훈련된 세 부분의 시스템으로 구성된다. 첫째, 엔코더가 압축되지 않은 데이터를 낮은 프레임율로 변환한다. 그 다음에는 ‘양자화기(Quantizer)’ 시스템이 나중에 원래 신호로 재생할 때 사용하는 가장 중요한 정보를 추적하면서 데이터를 목표 크기로 압축한다. 이렇게 압축된 신호는 네트워크를 통해 전송하거나 디스크에 저장한다. 마지막으로 디코더가 신경망을 사용해 압축된 데이터를 실시간으로 복구한다.
 
ⓒ MetaAI

신호의 핵심 요소를 유지하면서 오디오 데이터를 압축하는 기술을 개발하는 핵심은 판별기(Discriminator)의 사용에 있다. 판별기는 실제 샘플과 재구성된 샘플을 구별하는 작업을 수행하는데, 압축 모델은 압축 모델은 판별기를 속일 수 있을 만큼 원본과 유사한 재구성 샘플을 생성하고자 한다.

새 기술의 응용 분야에 대해 메타는 주로 네트워크 조건이 열악한 환경에서 더 빠르고 음질 좋은 통화를 지원하는 데 사용할 수 있다고 밝혔다. 또한 궁극적으로는 대역폭의 대대적인 개선 없이도 풍부한 메타버스 경험을 제공할 수 있을 것이라고 강조했다.
editor@itworld.co.kr
CIO Korea 뉴스레터 및 IT 트랜드 보고서 무료 구독하기
추천 테크라이브러리

회사명:한국IDG 제호: CIO Korea 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아01641 등록발행일자 : 2011년 05월 27일

발행인 : 박형미 편집인 : 천신응 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.