2019.12.11

음성 의료 기록을 ‘문자’로 변환··· 아마존, 트랜스크라이브 메디컬 출시

김달훈 | CIO KR
AWS(Amazon Web Services)가 의료 분야에 특화된 머신러닝 자동 음성인식(ASR;Automatic Speech Recognition) 서비스인 '아마존 트랜스크라이브 메디컬(Amazon Transcribe Medical, 이하 ATM)’을 출시했다. ATM은 AWS가 기존에 제공해 오던 아마존 트랜스크라이브를, 의학전문용어까지 인식하고 문자로 변환할 수 있도록 확장한 관리형 서비스다.

아마존 트랜스크라이브는 음성 인식과 문자 변환을 서비스 형태로 제공하고, 사용한 만큼 비용을 지불하고 확장과 축소가 간단하다. 스마트폰, 태블릿, 컴퓨터 등에 장착된 마이크를 통해 음성을 캡처해, 웹 소켓 프로토콜 기반의 스트리밍 API로 보내면, 실시간으로 음성을 인식하고 텍스트로 변환한다. 이렇게 인식과 문자 변환 과정을 거친 데이터를 필요하다면 아마존 S3(Amazon Simple Storage Service) 버킷에 저장할 수 있다.


아마존 웹 서비스가 새로 출시한 아마존 트랜스크라이브 메디컬은 의사가 진료 기록을 음성으로 기록할 수 있도록 해주는 서비스다. 의사가 말하는 내용을 마이크를 통해 실시간 오디오 스트리밍으로 전송하면, 이를 인식한 후 문장으로 변환해 기록해 준다.(화면 : AWS)

2017년 위스콘신대학교와 미국 의료협회가 발표한 연구보고서에 따르면, 미국에서 1차 진료 의사가 EHR(Electronic Health Record)에 진료 내용 등을 입력하는데, 하루 평균 6시간을 사용하는 것으로 나타났다. 이렇게 비효율적으로 낭비되는 시간을 최소화하기 위해, 필기 입력이나 음성 녹음을 활용해 진료 기록을 작성하는 방법이 사용되기도 한다. 

전자펜을 사용해 직접 손으로 써서 진료 기록을 입력하는 것은, 초기 투자 비용이 많이 들고, 적용할 수 있는 장치가 제한적이다. 진료 환경에 따라서는 필기 입력이 불편하거나 전혀 사용할 수 없는 경우가 생기기도 한다. 의사의 음성 기록을 전문 업체에 의뢰해, 사람이 직접 문자로 입력하는 서비스도 있지만, 이럴 경우 업무 처리에 많은 시간이 소요된다는 단점이 있다.

하지만 실시간으로 음성을 인식하고 텍스트로 변환할 수 있는 ATM을 활용하면, 데이터 입력 시간을 줄일 수 있어 시간과 비용을 절약할 수 있다는 것이 AWS의 설명이다. 특히 ATM은 실시간 자연어 처리와 지능형 구두점 기능을 제공하기 때문에, 훨씬 빠르고 효율적으로 사용할 수 있다고 AWS는 강조한다. 자연어 처리는 일상적인 대화나 진료를 하는 것처럼 자연스럽게 말하면 되는 것을 의미하고, 지능형 구두점은 “쉼표 추가”나 “느낌표” 같은 명령을 사용할 필요가 없도록 해준다. 

ATM의 서비스 요금은 초당 0.00125달러다. 이를 분으로 환산하면 1분에 0.075달러, 15분에 1.125달러, 30분은 2.25달러, 1시간이면 4.5달러가 된다. 우선 미국 동부의 버지니아 북부와 오하이오, 미국 서부의 오레곤, 아시아 태평양의 시드니, 캐나다의 중부, 유럽연합의 아일랜드 지역(Region)에서 서비스를 제공하기 시작했다. ATM을 비롯한 AWS의 다양한 트랜스크라이브 서비스에 대한 내용은 홈페이지에서 확인할 수 있다.
 



2019.12.11

음성 의료 기록을 ‘문자’로 변환··· 아마존, 트랜스크라이브 메디컬 출시

김달훈 | CIO KR
AWS(Amazon Web Services)가 의료 분야에 특화된 머신러닝 자동 음성인식(ASR;Automatic Speech Recognition) 서비스인 '아마존 트랜스크라이브 메디컬(Amazon Transcribe Medical, 이하 ATM)’을 출시했다. ATM은 AWS가 기존에 제공해 오던 아마존 트랜스크라이브를, 의학전문용어까지 인식하고 문자로 변환할 수 있도록 확장한 관리형 서비스다.

아마존 트랜스크라이브는 음성 인식과 문자 변환을 서비스 형태로 제공하고, 사용한 만큼 비용을 지불하고 확장과 축소가 간단하다. 스마트폰, 태블릿, 컴퓨터 등에 장착된 마이크를 통해 음성을 캡처해, 웹 소켓 프로토콜 기반의 스트리밍 API로 보내면, 실시간으로 음성을 인식하고 텍스트로 변환한다. 이렇게 인식과 문자 변환 과정을 거친 데이터를 필요하다면 아마존 S3(Amazon Simple Storage Service) 버킷에 저장할 수 있다.


아마존 웹 서비스가 새로 출시한 아마존 트랜스크라이브 메디컬은 의사가 진료 기록을 음성으로 기록할 수 있도록 해주는 서비스다. 의사가 말하는 내용을 마이크를 통해 실시간 오디오 스트리밍으로 전송하면, 이를 인식한 후 문장으로 변환해 기록해 준다.(화면 : AWS)

2017년 위스콘신대학교와 미국 의료협회가 발표한 연구보고서에 따르면, 미국에서 1차 진료 의사가 EHR(Electronic Health Record)에 진료 내용 등을 입력하는데, 하루 평균 6시간을 사용하는 것으로 나타났다. 이렇게 비효율적으로 낭비되는 시간을 최소화하기 위해, 필기 입력이나 음성 녹음을 활용해 진료 기록을 작성하는 방법이 사용되기도 한다. 

전자펜을 사용해 직접 손으로 써서 진료 기록을 입력하는 것은, 초기 투자 비용이 많이 들고, 적용할 수 있는 장치가 제한적이다. 진료 환경에 따라서는 필기 입력이 불편하거나 전혀 사용할 수 없는 경우가 생기기도 한다. 의사의 음성 기록을 전문 업체에 의뢰해, 사람이 직접 문자로 입력하는 서비스도 있지만, 이럴 경우 업무 처리에 많은 시간이 소요된다는 단점이 있다.

하지만 실시간으로 음성을 인식하고 텍스트로 변환할 수 있는 ATM을 활용하면, 데이터 입력 시간을 줄일 수 있어 시간과 비용을 절약할 수 있다는 것이 AWS의 설명이다. 특히 ATM은 실시간 자연어 처리와 지능형 구두점 기능을 제공하기 때문에, 훨씬 빠르고 효율적으로 사용할 수 있다고 AWS는 강조한다. 자연어 처리는 일상적인 대화나 진료를 하는 것처럼 자연스럽게 말하면 되는 것을 의미하고, 지능형 구두점은 “쉼표 추가”나 “느낌표” 같은 명령을 사용할 필요가 없도록 해준다. 

ATM의 서비스 요금은 초당 0.00125달러다. 이를 분으로 환산하면 1분에 0.075달러, 15분에 1.125달러, 30분은 2.25달러, 1시간이면 4.5달러가 된다. 우선 미국 동부의 버지니아 북부와 오하이오, 미국 서부의 오레곤, 아시아 태평양의 시드니, 캐나다의 중부, 유럽연합의 아일랜드 지역(Region)에서 서비스를 제공하기 시작했다. ATM을 비롯한 AWS의 다양한 트랜스크라이브 서비스에 대한 내용은 홈페이지에서 확인할 수 있다.
 

X