Offcanvas

������

'원격 일잘러' 되볼까?··· MS 팀즈 신기능 10가지 따라잡기

지난 약 1년 동안 마이크로소프트는 채팅 및 화상회의 허브인 팀즈(Teams)에 많은 새로운 기능을 추가했다. 주요 신기능이 무엇인지, 이들을 어떻게 활용하는지 살펴본다. 이 가이드에서는 마이크로소프트365/오피스365 비즈니스 및 에듀케이션 구독에 포함된 윈도우 및 맥OS용 마이크로소프트 팀 데스크톱 앱에 대해 다른다. 일부 기능은 무료 버전이나, 웹 또는 모바일 앱, 소비자용 버전에서 지원되지 않는다. 소회의실 소회의실(Breakout rooms) 기본적으로 더 큰 회의와 연동된 소형 회의실이다. 각 소회의실은 참가자 오디오 및 비디오 피드, 채팅창, 화면 공유 기능 등 대부분의 일반적인 회의 기능이 있다. 이를 통해 소규모 팀은 메인 회의가 진행되는 가운데 별도의 소회의실에서 서로 준비하고 상의할 수 있다. 다른 활용 시나리오도 있다. 모든 회의 참가자를 소회의실에 넣어 소규모 그룹 논의를 진행한 후 모두를 메인 회의로 복귀시킬 수 있다. 소회의실을 활용하면 본회의와 별개로 소규모 인원끼리 토론할 수 있다.  소회의실을 설정하려면 관리자 권한이 있는 회의 주최자 또는 발표자가 되어야 한다. 회의 중 회의창의 우측 상단에 있는 ‘소회의실’ 아이콘(큰 사각형 위의 작은 사각형)을 클릭하여 이 기능에 액세스할 수 있다. 그러면 창이 열리고 1개 이상의 소회의실을 생성한 후 수동으로 사람을 할당하거나 자동으로 할당되도록 할 수 있다. 또는 팀즈에서 회의 초대를 열고 ‘소회의실(Breakout rooms) > 방 만들기(Create rooms)’를 선택하여 소회의실을 설정할 수 있다. 소회의실 관리자는 소회의실 이름을 바꾸고 소회의 세션의 시간을 제한할 수 있다. 또 여러 소회의실을 오가고 소회의실에 발표내용을 전송하는 것이 가능하다. 자세한 내용은 소회의실 설정 및 관리에 관한 마이크로소프트의 지원 페이지를 참조한다. 개선된 화이트보드 팀즈는 오래 전부터 마이크로소프트의 화이트보드 앱과 통합되어 있었다. 덕분에 회의 참가자가 실시...

팀즈 영상회의 화상회의 녹취 전사 소회의실 스포트라이트 프레젠테이션

2022.01.18

지난 약 1년 동안 마이크로소프트는 채팅 및 화상회의 허브인 팀즈(Teams)에 많은 새로운 기능을 추가했다. 주요 신기능이 무엇인지, 이들을 어떻게 활용하는지 살펴본다. 이 가이드에서는 마이크로소프트365/오피스365 비즈니스 및 에듀케이션 구독에 포함된 윈도우 및 맥OS용 마이크로소프트 팀 데스크톱 앱에 대해 다른다. 일부 기능은 무료 버전이나, 웹 또는 모바일 앱, 소비자용 버전에서 지원되지 않는다. 소회의실 소회의실(Breakout rooms) 기본적으로 더 큰 회의와 연동된 소형 회의실이다. 각 소회의실은 참가자 오디오 및 비디오 피드, 채팅창, 화면 공유 기능 등 대부분의 일반적인 회의 기능이 있다. 이를 통해 소규모 팀은 메인 회의가 진행되는 가운데 별도의 소회의실에서 서로 준비하고 상의할 수 있다. 다른 활용 시나리오도 있다. 모든 회의 참가자를 소회의실에 넣어 소규모 그룹 논의를 진행한 후 모두를 메인 회의로 복귀시킬 수 있다. 소회의실을 활용하면 본회의와 별개로 소규모 인원끼리 토론할 수 있다.  소회의실을 설정하려면 관리자 권한이 있는 회의 주최자 또는 발표자가 되어야 한다. 회의 중 회의창의 우측 상단에 있는 ‘소회의실’ 아이콘(큰 사각형 위의 작은 사각형)을 클릭하여 이 기능에 액세스할 수 있다. 그러면 창이 열리고 1개 이상의 소회의실을 생성한 후 수동으로 사람을 할당하거나 자동으로 할당되도록 할 수 있다. 또는 팀즈에서 회의 초대를 열고 ‘소회의실(Breakout rooms) > 방 만들기(Create rooms)’를 선택하여 소회의실을 설정할 수 있다. 소회의실 관리자는 소회의실 이름을 바꾸고 소회의 세션의 시간을 제한할 수 있다. 또 여러 소회의실을 오가고 소회의실에 발표내용을 전송하는 것이 가능하다. 자세한 내용은 소회의실 설정 및 관리에 관한 마이크로소프트의 지원 페이지를 참조한다. 개선된 화이트보드 팀즈는 오래 전부터 마이크로소프트의 화이트보드 앱과 통합되어 있었다. 덕분에 회의 참가자가 실시...

2022.01.18

음성 의료 기록을 ‘문자’로 변환··· 아마존, 트랜스크라이브 메디컬 출시

AWS(Amazon Web Services)가 의료 분야에 특화된 머신러닝 자동 음성인식(ASR;Automatic Speech Recognition) 서비스인 '아마존 트랜스크라이브 메디컬(Amazon Transcribe Medical, 이하 ATM)’을 출시했다. ATM은 AWS가 기존에 제공해 오던 아마존 트랜스크라이브를, 의학전문용어까지 인식하고 문자로 변환할 수 있도록 확장한 관리형 서비스다. 아마존 트랜스크라이브는 음성 인식과 문자 변환을 서비스 형태로 제공하고, 사용한 만큼 비용을 지불하고 확장과 축소가 간단하다. 스마트폰, 태블릿, 컴퓨터 등에 장착된 마이크를 통해 음성을 캡처해, 웹 소켓 프로토콜 기반의 스트리밍 API로 보내면, 실시간으로 음성을 인식하고 텍스트로 변환한다. 이렇게 인식과 문자 변환 과정을 거친 데이터를 필요하다면 아마존 S3(Amazon Simple Storage Service) 버킷에 저장할 수 있다. 아마존 웹 서비스가 새로 출시한 아마존 트랜스크라이브 메디컬은 의사가 진료 기록을 음성으로 기록할 수 있도록 해주는 서비스다. 의사가 말하는 내용을 마이크를 통해 실시간 오디오 스트리밍으로 전송하면, 이를 인식한 후 문장으로 변환해 기록해 준다.(화면 : AWS) 2017년 위스콘신대학교와 미국 의료협회가 발표한 연구보고서에 따르면, 미국에서 1차 진료 의사가 EHR(Electronic Health Record)에 진료 내용 등을 입력하는데, 하루 평균 6시간을 사용하는 것으로 나타났다. 이렇게 비효율적으로 낭비되는 시간을 최소화하기 위해, 필기 입력이나 음성 녹음을 활용해 진료 기록을 작성하는 방법이 사용되기도 한다.  전자펜을 사용해 직접 손으로 써서 진료 기록을 입력하는 것은, 초기 투자 비용이 많이 들고, 적용할 수 있는 장치가 제한적이다. 진료 환경에 따라서는 필기 입력이 불편하거나 전혀 사용할 수 없는 경우가 생기기도 한다. 의사의 음성 기록을 전문 업체에 의뢰해, 사람이 직접 문자로 입력하는 서비...

녹취 STT 아마존 트랜스크라이브 메디컬

2019.12.11

AWS(Amazon Web Services)가 의료 분야에 특화된 머신러닝 자동 음성인식(ASR;Automatic Speech Recognition) 서비스인 '아마존 트랜스크라이브 메디컬(Amazon Transcribe Medical, 이하 ATM)’을 출시했다. ATM은 AWS가 기존에 제공해 오던 아마존 트랜스크라이브를, 의학전문용어까지 인식하고 문자로 변환할 수 있도록 확장한 관리형 서비스다. 아마존 트랜스크라이브는 음성 인식과 문자 변환을 서비스 형태로 제공하고, 사용한 만큼 비용을 지불하고 확장과 축소가 간단하다. 스마트폰, 태블릿, 컴퓨터 등에 장착된 마이크를 통해 음성을 캡처해, 웹 소켓 프로토콜 기반의 스트리밍 API로 보내면, 실시간으로 음성을 인식하고 텍스트로 변환한다. 이렇게 인식과 문자 변환 과정을 거친 데이터를 필요하다면 아마존 S3(Amazon Simple Storage Service) 버킷에 저장할 수 있다. 아마존 웹 서비스가 새로 출시한 아마존 트랜스크라이브 메디컬은 의사가 진료 기록을 음성으로 기록할 수 있도록 해주는 서비스다. 의사가 말하는 내용을 마이크를 통해 실시간 오디오 스트리밍으로 전송하면, 이를 인식한 후 문장으로 변환해 기록해 준다.(화면 : AWS) 2017년 위스콘신대학교와 미국 의료협회가 발표한 연구보고서에 따르면, 미국에서 1차 진료 의사가 EHR(Electronic Health Record)에 진료 내용 등을 입력하는데, 하루 평균 6시간을 사용하는 것으로 나타났다. 이렇게 비효율적으로 낭비되는 시간을 최소화하기 위해, 필기 입력이나 음성 녹음을 활용해 진료 기록을 작성하는 방법이 사용되기도 한다.  전자펜을 사용해 직접 손으로 써서 진료 기록을 입력하는 것은, 초기 투자 비용이 많이 들고, 적용할 수 있는 장치가 제한적이다. 진료 환경에 따라서는 필기 입력이 불편하거나 전혀 사용할 수 없는 경우가 생기기도 한다. 의사의 음성 기록을 전문 업체에 의뢰해, 사람이 직접 문자로 입력하는 서비...

2019.12.11

칼럼 | AI의 진짜 위협은 ‘인간다움’의 대체다

AI가 정녕 위협하는 대상은 일자리가 아닌 인간의 마음일 수 있다. 노트 작성을 예로 들어보자. 두 가지 일이 필요하다. 하나는 녹음(녹취)하는 것이다. 그러나 다른 하나는 생각하고, 정리하고, 우선순위를 정하고, 기억하는 것이다. 구글 AI는 확실히 첫 번째 일을 할 수 있다. 하지만 두 번째 일은 누구의 몫일까? AI가 우리의 일자리를 빼앗을 것이라는 우려가 존재한다. 사실 새로운 기술들은 이러한 두려움은 항상 동반해 왔다. 1967년, 미래학자이자 정치학자인 세바스찬 드 그라지아는 대부분의 인간의 노동이 불필요한 것이 될 것이기 때문에 2020년이 되면 자동화 기술이 주당 근로시간을 16시간으로 줄일 것이라고 예측했다. 그러면서 그는 이것을 부정적으로 바라봤다. ‘지루함, 게으름, 부도덕, 그리고 개인적인 폭력의 증가’를 야기할 것으로 예상했기 때문이다. 2020년이 몇 주 앞으로 다가온 현재, 그라지아가 상상하기 힘들었을 자동화 수준에도 불구하고, 주당 16시간 근무보다는 일일 16시간 근무가 가능성이 더 높다. 그리고 필자는 AI가 우리 일을 빼앗는 미래를 그리 걱정하지 않는다. 대신 AI가 우리의 마음을 빼앗을까 걱정한다. 이미 구글이 그러한 시도를 하고 있다.   2019년은 구글이 인간의 말하기를 대체하기 시작한 해 AI는 무수히 다양한 문제를 처리할 수 있다. 그 중 하나는 인간 언어의 문제다. 지난 1년 동안 구글은 당신을 위해 대화하는 아주 많은 AI 기반 제품들을 도입했는데, 이 제품 중 일부는 문장을 만들고 다른 사람들과 상호작용하면서 인간의 역할을 대체한다. 이를테면 구글은 지난해 구글 I/O 개발자 회의에서 듀플렉스(Duplex)라는 기술을 발표했다. 듀플렉스는 레스토랑에 전화를 걸어 예약을 한다. 그것은 또한 ‘스크린 콜’이라는 기능을 통해 사용자를 대신해 전화를 받을 수도 있다. 사용자는 구글 어시스턴트에게 ‘저녁 예약을 하라’라고 말함으로써 듀플렉스를 활성화시키게 된다. 그러면 어시스턴트는...

인간 글쓰기 녹취 필기 어시스턴트 인류 구글 듀플렉스 스마트 컴포즈 스크린 콜

2019.11.27

AI가 정녕 위협하는 대상은 일자리가 아닌 인간의 마음일 수 있다. 노트 작성을 예로 들어보자. 두 가지 일이 필요하다. 하나는 녹음(녹취)하는 것이다. 그러나 다른 하나는 생각하고, 정리하고, 우선순위를 정하고, 기억하는 것이다. 구글 AI는 확실히 첫 번째 일을 할 수 있다. 하지만 두 번째 일은 누구의 몫일까? AI가 우리의 일자리를 빼앗을 것이라는 우려가 존재한다. 사실 새로운 기술들은 이러한 두려움은 항상 동반해 왔다. 1967년, 미래학자이자 정치학자인 세바스찬 드 그라지아는 대부분의 인간의 노동이 불필요한 것이 될 것이기 때문에 2020년이 되면 자동화 기술이 주당 근로시간을 16시간으로 줄일 것이라고 예측했다. 그러면서 그는 이것을 부정적으로 바라봤다. ‘지루함, 게으름, 부도덕, 그리고 개인적인 폭력의 증가’를 야기할 것으로 예상했기 때문이다. 2020년이 몇 주 앞으로 다가온 현재, 그라지아가 상상하기 힘들었을 자동화 수준에도 불구하고, 주당 16시간 근무보다는 일일 16시간 근무가 가능성이 더 높다. 그리고 필자는 AI가 우리 일을 빼앗는 미래를 그리 걱정하지 않는다. 대신 AI가 우리의 마음을 빼앗을까 걱정한다. 이미 구글이 그러한 시도를 하고 있다.   2019년은 구글이 인간의 말하기를 대체하기 시작한 해 AI는 무수히 다양한 문제를 처리할 수 있다. 그 중 하나는 인간 언어의 문제다. 지난 1년 동안 구글은 당신을 위해 대화하는 아주 많은 AI 기반 제품들을 도입했는데, 이 제품 중 일부는 문장을 만들고 다른 사람들과 상호작용하면서 인간의 역할을 대체한다. 이를테면 구글은 지난해 구글 I/O 개발자 회의에서 듀플렉스(Duplex)라는 기술을 발표했다. 듀플렉스는 레스토랑에 전화를 걸어 예약을 한다. 그것은 또한 ‘스크린 콜’이라는 기능을 통해 사용자를 대신해 전화를 받을 수도 있다. 사용자는 구글 어시스턴트에게 ‘저녁 예약을 하라’라고 말함으로써 듀플렉스를 활성화시키게 된다. 그러면 어시스턴트는...

2019.11.27

MS, 2020년 워드에 강력한 클라우드 받아쓰기 및 녹취 서비스 넣는다

마이크로소프트 워드의 받아쓰기 기능이 오랜만에 변화될 것으로 기대된다. 2017년 PCWorld는 윈도우 내의 받아쓰기 기능이 엉망이며, 특히 개인 사용자가 트레이닝이 필요한 로컬 모델에 기반한다는 점을 비판한 바 있다. 이제 마이크로소프트는 이보다 훨씬 강력한 클라우드 받아쓰기 기능을 워드에 2020년부터 도입한다고 전했다. 그리고 녹취 기능도 함께 들어간다. 워드를 열고 오른쪽 상단에 있는 마이크 버튼을 클릭하면 이 버튼의 역할을 알 수 있다. 모델을 훈련시키거나 깔끔하게 이야기하지 않으면 윈도우는 몇 가지 주요 단어만 알아들을 뿐이다. 아쉽게도 여기서 윈도우가 알아듣는 주요 단어는 충분하지 않으며, 계속 수정해야 하기 때문에 업무 생산성이 높지 않다.  한편, 또 다른 클라우드 서비스인 코타나를 사용해보면 정확도가 상당히 높다는 점을 알 수 있다. 마이크로소프트는 빌드(Build) 시연 등에서 코타나의 강력한 클라우드 기반 녹취 서비스를 자랑했는데, 성능이 상당히 놀랍다. 이것이 바로 마이크로소프트가 2020년 워드에 도입할 받아쓰기 및 녹취의 성능이다. 마이크로소프트는 원드라이브와 애저 스피치 서비스를 사용해 안전하게 오디오 파일을 보관할 것이라고 밝혔는데, 이것이 오피스 365 및 기업 버전의 마이크로소프트 365와 긴밀히 연결됨을 의미한다. 물론 무료는 아니다. 마이크로소프트는 “워드의 오디오 녹취 기능은 2020년 초 웹 버전 워드에 적용되며, 이어서 데스크톱용 워드와 모바일 앱에도 적용될 것이다. 정확한 계획과 가격은 출시가 다가오면 발표될 것”이라고 전했다. 녹음된 오디오 파일을 업로드해서 녹취를 만들 수 있는데 발화자마다 구분된다. 마이크로소프트는 블로그에서 녹취 내용이 워드에 사이드바로 표시되어 편집 중인 문서로 가져올 수 있다고 설명했다. 마이크로소프트가 GIF로 올린 시연에서는 모든 작업이 즉각적으로 이루어지지만, 실제 클라우드 녹취는 처리에 시간이 걸릴 것으로 예상된다.  마이크로소프트가 제공하는 녹취의 정...

워드 녹취 받아쓰기

2019.10.07

마이크로소프트 워드의 받아쓰기 기능이 오랜만에 변화될 것으로 기대된다. 2017년 PCWorld는 윈도우 내의 받아쓰기 기능이 엉망이며, 특히 개인 사용자가 트레이닝이 필요한 로컬 모델에 기반한다는 점을 비판한 바 있다. 이제 마이크로소프트는 이보다 훨씬 강력한 클라우드 받아쓰기 기능을 워드에 2020년부터 도입한다고 전했다. 그리고 녹취 기능도 함께 들어간다. 워드를 열고 오른쪽 상단에 있는 마이크 버튼을 클릭하면 이 버튼의 역할을 알 수 있다. 모델을 훈련시키거나 깔끔하게 이야기하지 않으면 윈도우는 몇 가지 주요 단어만 알아들을 뿐이다. 아쉽게도 여기서 윈도우가 알아듣는 주요 단어는 충분하지 않으며, 계속 수정해야 하기 때문에 업무 생산성이 높지 않다.  한편, 또 다른 클라우드 서비스인 코타나를 사용해보면 정확도가 상당히 높다는 점을 알 수 있다. 마이크로소프트는 빌드(Build) 시연 등에서 코타나의 강력한 클라우드 기반 녹취 서비스를 자랑했는데, 성능이 상당히 놀랍다. 이것이 바로 마이크로소프트가 2020년 워드에 도입할 받아쓰기 및 녹취의 성능이다. 마이크로소프트는 원드라이브와 애저 스피치 서비스를 사용해 안전하게 오디오 파일을 보관할 것이라고 밝혔는데, 이것이 오피스 365 및 기업 버전의 마이크로소프트 365와 긴밀히 연결됨을 의미한다. 물론 무료는 아니다. 마이크로소프트는 “워드의 오디오 녹취 기능은 2020년 초 웹 버전 워드에 적용되며, 이어서 데스크톱용 워드와 모바일 앱에도 적용될 것이다. 정확한 계획과 가격은 출시가 다가오면 발표될 것”이라고 전했다. 녹음된 오디오 파일을 업로드해서 녹취를 만들 수 있는데 발화자마다 구분된다. 마이크로소프트는 블로그에서 녹취 내용이 워드에 사이드바로 표시되어 편집 중인 문서로 가져올 수 있다고 설명했다. 마이크로소프트가 GIF로 올린 시연에서는 모든 작업이 즉각적으로 이루어지지만, 실제 클라우드 녹취는 처리에 시간이 걸릴 것으로 예상된다.  마이크로소프트가 제공하는 녹취의 정...

2019.10.07

"AI가 자동 녹취해 텍스트 변환"··· MS, 원드라이브·셰어포인트에 신기능 적용 예정

오피스 365 콘텐츠 협업 도구들이 올해 말 업데이트될 예정이다. AI 기능성을 지원하는 파일 추천 기능 또한 원드라이브에 적용된다. 마이크로소프트가 원드라이브 포 비즈니스 및 셰어포인트에 오디오 사본 작성(audio transcription) 기능을 추가한다. 이를 이용하면 사용자는 다양한 디지털 콘텐츠에 보다 쉽게 접근할 수 있게 된다. 즉, 동영상이나 오디오 파일을 재생할 때 파일 내 대화의 전체 사본이 자동으로 작성된다. 마이크로소프트 스트림(과거 오피스 365 비디오)의 AI 기술을 이용해서다. 회사는 이 새로운 서비스가 올해 말 오피스 365 사용자에게 제공될 것이라고 28일 밝혔다. 마이크로소프트는 또 변환된 텍스트 데이터가 클라우드에 저장될 것이며, 서드파티 녹취 도구를 이용하는 것보다 더 저렴해지고 안전해질 것이라고 설명했다. 다른 인텔리전트 기능도 추가된다. AI가 사진에서 위치 정보를 추출하고 사진 속 객체를 인식하며 이미지에서 텍스트를 추출하는 인텔리전트 검색 기능이다. 지난해 9월 등장한 이 기능를 통해 사용자는 이미지 파일을 텍스트 문서처럼 검색할 수 있게 된다고 회사 측은 설명했다. 글로벌데이터 수석 애널리스트 팀 반팅은 마이크로소프트의 이번 행보에 대해 "오디오나 동영상 파일과 같은 파일 자산으로부터 가치를 좀더 쉽게 이끌어낼 수 있게 해준다. 특히 이런 파일들은 셰어포인트나 원드라이브에 숨어 있을 수 있기 때문에 활용성이 커진다"라고 전했다. 자동 녹취 기능과 접목되면 더욱 중요해진다고 그는 덧붙였다. 반팅은 "회의 내용을 몇 시간씩 앉아 씨름하면서 확인하지 않아도 된다. 액션 아이템, 프로젝트 이름, 기업 이름 등을 손쉽게 찾아 확인할 수 있다"라고 말했다. 프로폼 다이나믹스의 서비스 디렉터이자 리서치 애널리스트인 리처드 에드워즈는 텍스트 검색의 유용성을 인정하면서도, 기대치를 절제할 필요가 있다고 말했다. 그는 "가령 'Azure&...

셰어포인트 마이크로소프트 원드라이브 녹취

2018.08.31

오피스 365 콘텐츠 협업 도구들이 올해 말 업데이트될 예정이다. AI 기능성을 지원하는 파일 추천 기능 또한 원드라이브에 적용된다. 마이크로소프트가 원드라이브 포 비즈니스 및 셰어포인트에 오디오 사본 작성(audio transcription) 기능을 추가한다. 이를 이용하면 사용자는 다양한 디지털 콘텐츠에 보다 쉽게 접근할 수 있게 된다. 즉, 동영상이나 오디오 파일을 재생할 때 파일 내 대화의 전체 사본이 자동으로 작성된다. 마이크로소프트 스트림(과거 오피스 365 비디오)의 AI 기술을 이용해서다. 회사는 이 새로운 서비스가 올해 말 오피스 365 사용자에게 제공될 것이라고 28일 밝혔다. 마이크로소프트는 또 변환된 텍스트 데이터가 클라우드에 저장될 것이며, 서드파티 녹취 도구를 이용하는 것보다 더 저렴해지고 안전해질 것이라고 설명했다. 다른 인텔리전트 기능도 추가된다. AI가 사진에서 위치 정보를 추출하고 사진 속 객체를 인식하며 이미지에서 텍스트를 추출하는 인텔리전트 검색 기능이다. 지난해 9월 등장한 이 기능를 통해 사용자는 이미지 파일을 텍스트 문서처럼 검색할 수 있게 된다고 회사 측은 설명했다. 글로벌데이터 수석 애널리스트 팀 반팅은 마이크로소프트의 이번 행보에 대해 "오디오나 동영상 파일과 같은 파일 자산으로부터 가치를 좀더 쉽게 이끌어낼 수 있게 해준다. 특히 이런 파일들은 셰어포인트나 원드라이브에 숨어 있을 수 있기 때문에 활용성이 커진다"라고 전했다. 자동 녹취 기능과 접목되면 더욱 중요해진다고 그는 덧붙였다. 반팅은 "회의 내용을 몇 시간씩 앉아 씨름하면서 확인하지 않아도 된다. 액션 아이템, 프로젝트 이름, 기업 이름 등을 손쉽게 찾아 확인할 수 있다"라고 말했다. 프로폼 다이나믹스의 서비스 디렉터이자 리서치 애널리스트인 리처드 에드워즈는 텍스트 검색의 유용성을 인정하면서도, 기대치를 절제할 필요가 있다고 말했다. 그는 "가령 'Azure&...

2018.08.31

'음성을 문자로 바꿔주는' 소프트웨어 8선

최근 몇 년 동안 음성 인식과 말을 문자로 바꿔주는 소프트웨어가 인기를 끌었다. 장애인 지원, 외국어 학습, 녹취 스트레스 해소 등 말을 문자로 바꿔주는 소프트웨어를 사용하는 데에는 여러 이유가 있다. 특히나 언론인들인 이 일이 얼마나 부담이 큰지 잘 알고 있다. 시중에 나와 있는 ‘말을 문자로 바꿔주는 소프트웨어’에는 어떤 것들이 있는지 알아보자. 1. 드래곤 내추럴리 스피킹 뉘앙스(Nuance)의 드래콘 내추럴리 스피킹(Dragon Naturally Speaking, DNS, PC용)은 8개 언어로 제공되는 음성 인식 소프트웨어다. DNS는 99%의 정확도를 자랑하며 현재 시장에서 가장 정확한 소프트웨어 중 하나로 인정받고 있다. DNS에는 음성 명령을 포함하고 있어 사용자가 컴퓨터 작업 및 파일 전송을 위한 사용자 지정 명령을 추가해 음성으로 텍스트의 서식을 지정하고 편집할 수 있다. 윈도우, 맥, iOS, 안드로이드 기기에서 실행할 수 있다. DNS는 음성 명령 및 편집 기능을 통합해 사용자가 음성을 전달하는 것처럼 텍스트가 제공되도록 하고 스피커에서 명령에 따라 특정 구두점 및 서식 옵션을 삽입한다. 최신 버전의 소프트웨어인 DNS 13은 가정용, 프리미엄 및 프로페셔널 버전에서 사용이 있으며 사용자는 사용자 지정 단어 목록을 가져오고 내보낼 수 있으므로 이미 어휘에 포함되어 있지 않은 특정 단어 및 약어를 추가할 수 있다. 뉘앙스 홈 에디션은 79.99파운드, 프리미엄은 125.99파운드, 프로페셔널 에디션은 279.99파운드에서 각각 시작한다. 2. 아마존 트랜스크라이브 아마존 트랜스크라이브(Amazon Transcribe)는 딥러닝으로 구동되는 자동 음성 인식 서비스다. 이 소프트웨어는 앱에 ‘음성을 텍스트로 전환’ 기능을 추가하고 싶어 하는 개발자에게 가장 적합하다. 또한 고객 서비스 요청에 ...

구글 트린트 WSR 윈도우 음성 인식 테미 아마존 트랜스크라이브 드래곤 내추럴리 스피킹 외국어 녹취 뉘앙스 장애인 인공지능 음성인식 비스타 소프트웨어 마이크로소프트 아마존 오트랜스크라이브

2018.05.15

최근 몇 년 동안 음성 인식과 말을 문자로 바꿔주는 소프트웨어가 인기를 끌었다. 장애인 지원, 외국어 학습, 녹취 스트레스 해소 등 말을 문자로 바꿔주는 소프트웨어를 사용하는 데에는 여러 이유가 있다. 특히나 언론인들인 이 일이 얼마나 부담이 큰지 잘 알고 있다. 시중에 나와 있는 ‘말을 문자로 바꿔주는 소프트웨어’에는 어떤 것들이 있는지 알아보자. 1. 드래곤 내추럴리 스피킹 뉘앙스(Nuance)의 드래콘 내추럴리 스피킹(Dragon Naturally Speaking, DNS, PC용)은 8개 언어로 제공되는 음성 인식 소프트웨어다. DNS는 99%의 정확도를 자랑하며 현재 시장에서 가장 정확한 소프트웨어 중 하나로 인정받고 있다. DNS에는 음성 명령을 포함하고 있어 사용자가 컴퓨터 작업 및 파일 전송을 위한 사용자 지정 명령을 추가해 음성으로 텍스트의 서식을 지정하고 편집할 수 있다. 윈도우, 맥, iOS, 안드로이드 기기에서 실행할 수 있다. DNS는 음성 명령 및 편집 기능을 통합해 사용자가 음성을 전달하는 것처럼 텍스트가 제공되도록 하고 스피커에서 명령에 따라 특정 구두점 및 서식 옵션을 삽입한다. 최신 버전의 소프트웨어인 DNS 13은 가정용, 프리미엄 및 프로페셔널 버전에서 사용이 있으며 사용자는 사용자 지정 단어 목록을 가져오고 내보낼 수 있으므로 이미 어휘에 포함되어 있지 않은 특정 단어 및 약어를 추가할 수 있다. 뉘앙스 홈 에디션은 79.99파운드, 프리미엄은 125.99파운드, 프로페셔널 에디션은 279.99파운드에서 각각 시작한다. 2. 아마존 트랜스크라이브 아마존 트랜스크라이브(Amazon Transcribe)는 딥러닝으로 구동되는 자동 음성 인식 서비스다. 이 소프트웨어는 앱에 ‘음성을 텍스트로 전환’ 기능을 추가하고 싶어 하는 개발자에게 가장 적합하다. 또한 고객 서비스 요청에 ...

2018.05.15

블로그 | 인터뷰·통화녹음 추천 앱 5종

스마트폰의 녹음 기능이 요긴한 경우가 있다.. 다음 5종의 앱은 녹음 파일 내 이동, 다양한 형식 지원, 클라우드 서비스에 저장, 통화 녹음 등의 기능을 지원하는 유용한 것들이다. 먼저 피오 스마트 레코더(iOS, 무료)가 있다. 이 앱은 녹음 파일의 중요 영역을 북마크할 수 있는 것이 특징이다. 컨퍼런스 현장에서 발표자가 중언부언하고 있다가 갑자기 중요한 내용을 말하기 시작한 상황이라고 가정하자. 이 때 사용자는 이 지점을 표시할 수 있도록 두드리기만 하면 된다. 5분 후 발표자가 다시 쓸모 없는 말을 한다면, 북마크를 끝내기 위해 화면을 다시 두드리면 된다. 물론 녹음 후 북마크 영역만 간단하게 선택해 확인할 수 있다. 피오는 또 드롭박스나 구글 드라이브에 녹음 파일을 저장할 수 있게 해준다. 단 이를 위해서는 1달러를 지불해야 한다. 또 프로젝트 폴더별로 녹음 파일을 정렬할 수 있는 기능을 지원하는데, 기본값은 최대 3개의 폴더다. 폴더 제한을 풀기 위해서는 1달러를 지불해야 한다. 이 밖에 북마크된 영역이 m4a라는 개별적 오디오 파일로도 저장되는 기능을 지원한다. 보이스 레코드 프로(무료, 광고 차단 버전은 3달러) 또한 또 하나의 멋진 iOS 오디오 레코딩 앱이다. MP3와 WAV 등 다양한 형식을 지원하며 구글 드라이브, 드롭박스, 원드라이브, 박스, 사운드클라우드 등으로는 저장과 불러오기를 지원한다. 북마크 기능도 갖췄다. 이지 보이스 레코더 프로(4달러)는 안드로이드도 지원하는 양질의 녹음 앱이다. 여러 형식을 지원할 뿐 아니라 입력 볼륨을 증폭시키는 기능도 지원한다. 묵음 구간을 스킵하는 기능도 갖췄다. 음성 통화 녹음 기능까지 필요하다면 테이프어콜프로(연간 10달러)를 검토할 만 하다. 이 앱은 발신자와 수신자 사이에 3개의 커넥션 방안을 생성해 통화를 녹음한다. 설정 작업 일부가 필요하지만 그리 오래 걸리지는 않는다. 또 녹음 과정이 원격 서버에서 처리되는 특징도 지녔다. 콜 레코더(무료)는 통화를 드롭박스...

인터뷰 녹취 녹음

2015.07.22

스마트폰의 녹음 기능이 요긴한 경우가 있다.. 다음 5종의 앱은 녹음 파일 내 이동, 다양한 형식 지원, 클라우드 서비스에 저장, 통화 녹음 등의 기능을 지원하는 유용한 것들이다. 먼저 피오 스마트 레코더(iOS, 무료)가 있다. 이 앱은 녹음 파일의 중요 영역을 북마크할 수 있는 것이 특징이다. 컨퍼런스 현장에서 발표자가 중언부언하고 있다가 갑자기 중요한 내용을 말하기 시작한 상황이라고 가정하자. 이 때 사용자는 이 지점을 표시할 수 있도록 두드리기만 하면 된다. 5분 후 발표자가 다시 쓸모 없는 말을 한다면, 북마크를 끝내기 위해 화면을 다시 두드리면 된다. 물론 녹음 후 북마크 영역만 간단하게 선택해 확인할 수 있다. 피오는 또 드롭박스나 구글 드라이브에 녹음 파일을 저장할 수 있게 해준다. 단 이를 위해서는 1달러를 지불해야 한다. 또 프로젝트 폴더별로 녹음 파일을 정렬할 수 있는 기능을 지원하는데, 기본값은 최대 3개의 폴더다. 폴더 제한을 풀기 위해서는 1달러를 지불해야 한다. 이 밖에 북마크된 영역이 m4a라는 개별적 오디오 파일로도 저장되는 기능을 지원한다. 보이스 레코드 프로(무료, 광고 차단 버전은 3달러) 또한 또 하나의 멋진 iOS 오디오 레코딩 앱이다. MP3와 WAV 등 다양한 형식을 지원하며 구글 드라이브, 드롭박스, 원드라이브, 박스, 사운드클라우드 등으로는 저장과 불러오기를 지원한다. 북마크 기능도 갖췄다. 이지 보이스 레코더 프로(4달러)는 안드로이드도 지원하는 양질의 녹음 앱이다. 여러 형식을 지원할 뿐 아니라 입력 볼륨을 증폭시키는 기능도 지원한다. 묵음 구간을 스킵하는 기능도 갖췄다. 음성 통화 녹음 기능까지 필요하다면 테이프어콜프로(연간 10달러)를 검토할 만 하다. 이 앱은 발신자와 수신자 사이에 3개의 커넥션 방안을 생성해 통화를 녹음한다. 설정 작업 일부가 필요하지만 그리 오래 걸리지는 않는다. 또 녹음 과정이 원격 서버에서 처리되는 특징도 지녔다. 콜 레코더(무료)는 통화를 드롭박스...

2015.07.22

음성 인식 기술에 기업이 주목해야 할 이유 있다 <뉘앙스>

음성 인식 기술이 나날이 고도화되고 있다. 스마트폰 분야에서는 이미 수년 전부터 등장해 활용되고 있다. 그러나 엔터프라이즈 측면에서는 그리 이목을 집중시키지 못했던 것이 사실이다. 뉘앙스 커뮤니케이션이 최근 진행한 비즈니스-효율성 설문조사에 따르면, 이러한 양상이 변화를 앞두고 있다. 영국, 프랑스, 독일 기업을 대상으로 진행한 이번 조사에 따르면, 문서 작성 및 편집에 소요하는 시간이 평균적으로 일 2시간에 달했다. 4시간 정도를 소비하는 비율오 1/4에 달했으며 5시간 이상이라는 응답도 적지 않았다. 또 많은 응답자들이 텍스트 작성 및 편집 시간을 '낭비'로 느끼고 있었다. 출장 및 미팅보다 더 큰 시간 낭비라는 응답도 상당수였다. 이번 설문조사를 진행한 뉘앙스는 음성 인식 소프트웨어가 타이핑 시간을 3시간까지 줄여줄 수 있다고 제시하며, 특히 카피라이터, 번역, 타이핑 기업의 경우 매출을 3배까지 늘릴 수도 있다고 강조했다. 또 단어와 매출이 직결되지 않는 업종인 경우에도 문서 작성 시간을 줄임으로써 생산성을 높일 수 있다고 덧붙였다. 뉘앙스는 특히 훈련에 별다른 자원이 요구되지 않는다고 언급했다. '뉘앙스 드래곤 내추럴리스피킹 13' 등의 회사 솔루션을 이용하면 훈련이 전혀 필요하지 않기도 하다는 설명이다. 시간이 지남에 따라 스스로 학습한는 이 소프트웨어는 현재 99%의 정확성을 보이고 있으며, 마이크로소프트 오피스 애플리케이션과 연계해 사용할 수 있다고 회사는 덧붙였다. 뉘앙스는 이 밖에 외부에서의 발언을 즉시 텍스트화할 수 있는 등 즉시성을 높일 수 있으며, 자료를 분실할 가능성도 낮출 수 있는 것도 음성 인식 기술이 가져다줄 수 있는 혜택이라고 제시했다. ciokr@idg.co.kr 

음성 인식 뉘앙스 녹취

2015.05.21

음성 인식 기술이 나날이 고도화되고 있다. 스마트폰 분야에서는 이미 수년 전부터 등장해 활용되고 있다. 그러나 엔터프라이즈 측면에서는 그리 이목을 집중시키지 못했던 것이 사실이다. 뉘앙스 커뮤니케이션이 최근 진행한 비즈니스-효율성 설문조사에 따르면, 이러한 양상이 변화를 앞두고 있다. 영국, 프랑스, 독일 기업을 대상으로 진행한 이번 조사에 따르면, 문서 작성 및 편집에 소요하는 시간이 평균적으로 일 2시간에 달했다. 4시간 정도를 소비하는 비율오 1/4에 달했으며 5시간 이상이라는 응답도 적지 않았다. 또 많은 응답자들이 텍스트 작성 및 편집 시간을 '낭비'로 느끼고 있었다. 출장 및 미팅보다 더 큰 시간 낭비라는 응답도 상당수였다. 이번 설문조사를 진행한 뉘앙스는 음성 인식 소프트웨어가 타이핑 시간을 3시간까지 줄여줄 수 있다고 제시하며, 특히 카피라이터, 번역, 타이핑 기업의 경우 매출을 3배까지 늘릴 수도 있다고 강조했다. 또 단어와 매출이 직결되지 않는 업종인 경우에도 문서 작성 시간을 줄임으로써 생산성을 높일 수 있다고 덧붙였다. 뉘앙스는 특히 훈련에 별다른 자원이 요구되지 않는다고 언급했다. '뉘앙스 드래곤 내추럴리스피킹 13' 등의 회사 솔루션을 이용하면 훈련이 전혀 필요하지 않기도 하다는 설명이다. 시간이 지남에 따라 스스로 학습한는 이 소프트웨어는 현재 99%의 정확성을 보이고 있으며, 마이크로소프트 오피스 애플리케이션과 연계해 사용할 수 있다고 회사는 덧붙였다. 뉘앙스는 이 밖에 외부에서의 발언을 즉시 텍스트화할 수 있는 등 즉시성을 높일 수 있으며, 자료를 분실할 가능성도 낮출 수 있는 것도 음성 인식 기술이 가져다줄 수 있는 혜택이라고 제시했다. ciokr@idg.co.kr 

2015.05.21

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.6