2018.05.15

'음성을 문자로 바꿔주는' 소프트웨어 8선

Hannah Williams | Computerworld UK

최근 몇 년 동안 음성 인식과 말을 문자로 바꿔주는 소프트웨어가 인기를 끌었다.

장애인 지원, 외국어 학습, 녹취 스트레스 해소 등 말을 문자로 바꿔주는 소프트웨어를 사용하는 데에는 여러 이유가 있다. 특히나 언론인들인 이 일이 얼마나 부담이 큰지 잘 알고 있다.

시중에 나와 있는 ‘말을 문자로 바꿔주는 소프트웨어’에는 어떤 것들이 있는지 알아보자.

1. 드래곤 내추럴리 스피킹


뉘앙스(Nuance)의 드래콘 내추럴리 스피킹(Dragon Naturally Speaking, DNS, PC용)은 8개 언어로 제공되는 음성 인식 소프트웨어다. DNS는 99%의 정확도를 자랑하며 현재 시장에서 가장 정확한 소프트웨어 중 하나로 인정받고 있다.

DNS에는 음성 명령을 포함하고 있어 사용자가 컴퓨터 작업 및 파일 전송을 위한 사용자 지정 명령을 추가해 음성으로 텍스트의 서식을 지정하고 편집할 수 있다. 윈도우, 맥, iOS, 안드로이드 기기에서 실행할 수 있다.

DNS는 음성 명령 및 편집 기능을 통합해 사용자가 음성을 전달하는 것처럼 텍스트가 제공되도록 하고 스피커에서 명령에 따라 특정 구두점 및 서식 옵션을 삽입한다.

최신 버전의 소프트웨어인 DNS 13은 가정용, 프리미엄 및 프로페셔널 버전에서 사용이 있으며 사용자는 사용자 지정 단어 목록을 가져오고 내보낼 수 있으므로 이미 어휘에 포함되어 있지 않은 특정 단어 및 약어를 추가할 수 있다.

뉘앙스 홈 에디션은 79.99파운드, 프리미엄은 125.99파운드, 프로페셔널 에디션은 279.99파운드에서 각각 시작한다.

2. 아마존 트랜스크라이브


아마존 트랜스크라이브(Amazon Transcribe)는 딥러닝으로 구동되는 자동 음성 인식 서비스다. 이 소프트웨어는 앱에 ‘음성을 텍스트로 전환’ 기능을 추가하고 싶어 하는 개발자에게 가장 적합하다.

또한 고객 서비스 요청에 대한 자세한 내용을 포함하여 오디오 및 비디오 파일을 복사하는 데에도 사용할 수 있다. 따라서 고객사와 회의 시 회의록을 작성해야 하는 업무 담당자에게 좋다.

임베디드된 API는 사용이 간편하며 아마존 S3에 저장된 파일의 사본을 신속하게 전송해 준다. 이밖에 각 단어에 대한 타임스탬프뿐 아니라 기존에 없던 새로운 단어나 약어를 추가하기 위해 어휘를 사용자 정의할 수 있다.

아마존 트랜스크라이브는 1년 동안 매월 60분의 무료 티어를 제공하며 가격은 초당 0.0004달러다.

3. 테미


테미(Temi)는 단 5분 만에 음성 데이터를 텍스트 데이터로 전환하는 자동 소프트웨어를 사용한다.

사용자는 이 앱으로 녹음하고 편집하며 공유할 수 있으며, 애플의 앱스토어와 구글 플레이에서 무료로 내려받을 수 있다.

이 앱에는 분당 0.10달러다. 여기에는 맞춤 타임스탬프, 화자(Speaker) 신분 확인, 앱에서 직접 사본을 MS 워드 및 기타 형식으로 내보낼 수 있는 기능도 들어 있다. 또한 테미는 사용자의 이메일에 직접 파일을 전송해 주기도 한다.

2018.05.15

'음성을 문자로 바꿔주는' 소프트웨어 8선

Hannah Williams | Computerworld UK

최근 몇 년 동안 음성 인식과 말을 문자로 바꿔주는 소프트웨어가 인기를 끌었다.

장애인 지원, 외국어 학습, 녹취 스트레스 해소 등 말을 문자로 바꿔주는 소프트웨어를 사용하는 데에는 여러 이유가 있다. 특히나 언론인들인 이 일이 얼마나 부담이 큰지 잘 알고 있다.

시중에 나와 있는 ‘말을 문자로 바꿔주는 소프트웨어’에는 어떤 것들이 있는지 알아보자.

1. 드래곤 내추럴리 스피킹


뉘앙스(Nuance)의 드래콘 내추럴리 스피킹(Dragon Naturally Speaking, DNS, PC용)은 8개 언어로 제공되는 음성 인식 소프트웨어다. DNS는 99%의 정확도를 자랑하며 현재 시장에서 가장 정확한 소프트웨어 중 하나로 인정받고 있다.

DNS에는 음성 명령을 포함하고 있어 사용자가 컴퓨터 작업 및 파일 전송을 위한 사용자 지정 명령을 추가해 음성으로 텍스트의 서식을 지정하고 편집할 수 있다. 윈도우, 맥, iOS, 안드로이드 기기에서 실행할 수 있다.

DNS는 음성 명령 및 편집 기능을 통합해 사용자가 음성을 전달하는 것처럼 텍스트가 제공되도록 하고 스피커에서 명령에 따라 특정 구두점 및 서식 옵션을 삽입한다.

최신 버전의 소프트웨어인 DNS 13은 가정용, 프리미엄 및 프로페셔널 버전에서 사용이 있으며 사용자는 사용자 지정 단어 목록을 가져오고 내보낼 수 있으므로 이미 어휘에 포함되어 있지 않은 특정 단어 및 약어를 추가할 수 있다.

뉘앙스 홈 에디션은 79.99파운드, 프리미엄은 125.99파운드, 프로페셔널 에디션은 279.99파운드에서 각각 시작한다.

2. 아마존 트랜스크라이브


아마존 트랜스크라이브(Amazon Transcribe)는 딥러닝으로 구동되는 자동 음성 인식 서비스다. 이 소프트웨어는 앱에 ‘음성을 텍스트로 전환’ 기능을 추가하고 싶어 하는 개발자에게 가장 적합하다.

또한 고객 서비스 요청에 대한 자세한 내용을 포함하여 오디오 및 비디오 파일을 복사하는 데에도 사용할 수 있다. 따라서 고객사와 회의 시 회의록을 작성해야 하는 업무 담당자에게 좋다.

임베디드된 API는 사용이 간편하며 아마존 S3에 저장된 파일의 사본을 신속하게 전송해 준다. 이밖에 각 단어에 대한 타임스탬프뿐 아니라 기존에 없던 새로운 단어나 약어를 추가하기 위해 어휘를 사용자 정의할 수 있다.

아마존 트랜스크라이브는 1년 동안 매월 60분의 무료 티어를 제공하며 가격은 초당 0.0004달러다.

3. 테미


테미(Temi)는 단 5분 만에 음성 데이터를 텍스트 데이터로 전환하는 자동 소프트웨어를 사용한다.

사용자는 이 앱으로 녹음하고 편집하며 공유할 수 있으며, 애플의 앱스토어와 구글 플레이에서 무료로 내려받을 수 있다.

이 앱에는 분당 0.10달러다. 여기에는 맞춤 타임스탬프, 화자(Speaker) 신분 확인, 앱에서 직접 사본을 MS 워드 및 기타 형식으로 내보낼 수 있는 기능도 들어 있다. 또한 테미는 사용자의 이메일에 직접 파일을 전송해 주기도 한다.

X