Offcanvas

������������

영어 '음성'을 '문서'로 변환··· 마이크로소프트 365 워드, 전사 및 음성 명령 지원

마이크로소프트의 댄 패리쉬 수석 그룹 PM 관리자(Dan Parish, Principal Group PM Manager)가 애저 코그너티브(Azure Cognitive Services) 인공지능 플랫폼을 활용한, 마이크로소프트 365(Microsoft 365) 워드(Word)의 전사(transcription)와 음성 명령(Voice Commandsr) 기능을 '마이크로소프트 365 블로그'를 통해 공개했다. '마이크로소프트 365'는 ‘오피스 365’의 새 이름으로, 워드, 엑셀, 파워포인트, 원노트 등으로 구성된 클라우드 서비스다. 마이크로소프트 365는 두 가지 방법으로 사용한다. 첫 번째는 PC, 태블릿, 스마트폰에 앱을 다운로드받은 후 설치해서 사용한다. 두 번째는 앱을 설치할 필요 없이 웹 브라우저로 서버에 접속한 후 사용하는 방법이 있다. 애저 코그너티브와 마이크로소프트 365의 만남 AI 플랫폼의 활용 방법은 다양하다. 인공지능에게 스스로 재주와 실력을 키워가는 머신러닝 능력을 부여하고, API(Application Programming Interface)라는 문을 달고 길을 열어주면, 만능은 아닐지언정 팔방미인 소리는 들을 수 있는 다양한 솔루션과 서비스를 만들어 낼 수 있다. 마이크로소프트의 애저 코그너티브가 그런 것 중에 하나다. 기계 학습에 대한 전문지식이 없는 개발자라도, API 호출만으로 보고, 듣고, 말하는 것과 관련된 인공지능 능력을 응용프로그램에 적용할 수 있다. 물론 마이크로소프트도 애저 코그너티브를 자사 제품에 활용한다. 애저 코그너티브는 음성, 언어, 비전, 앱서치 등의 인공지능 서비스를 인공지능에 관한 전문지식이 없는 개발자도 쉽게 사용할 수 있도록 API로 제공한다. (화면 : Microsoft) 이번에 발표한 마이크로소프트 365에서 ‘음성 명령으로 받아쓰기’와 웹 버전 워드(Word)에서 사용할 수 있는 ‘전사’ 기능은, 이러한 마이크로소프트 코그너티브 서비스와 연동해서 제공하는 기능이다. 음성 인식과 분석을...

마이크로소프트 365 마이크로소프트 워드 전사 받아쓰기 애저 코그너티브

2020.08.28

마이크로소프트의 댄 패리쉬 수석 그룹 PM 관리자(Dan Parish, Principal Group PM Manager)가 애저 코그너티브(Azure Cognitive Services) 인공지능 플랫폼을 활용한, 마이크로소프트 365(Microsoft 365) 워드(Word)의 전사(transcription)와 음성 명령(Voice Commandsr) 기능을 '마이크로소프트 365 블로그'를 통해 공개했다. '마이크로소프트 365'는 ‘오피스 365’의 새 이름으로, 워드, 엑셀, 파워포인트, 원노트 등으로 구성된 클라우드 서비스다. 마이크로소프트 365는 두 가지 방법으로 사용한다. 첫 번째는 PC, 태블릿, 스마트폰에 앱을 다운로드받은 후 설치해서 사용한다. 두 번째는 앱을 설치할 필요 없이 웹 브라우저로 서버에 접속한 후 사용하는 방법이 있다. 애저 코그너티브와 마이크로소프트 365의 만남 AI 플랫폼의 활용 방법은 다양하다. 인공지능에게 스스로 재주와 실력을 키워가는 머신러닝 능력을 부여하고, API(Application Programming Interface)라는 문을 달고 길을 열어주면, 만능은 아닐지언정 팔방미인 소리는 들을 수 있는 다양한 솔루션과 서비스를 만들어 낼 수 있다. 마이크로소프트의 애저 코그너티브가 그런 것 중에 하나다. 기계 학습에 대한 전문지식이 없는 개발자라도, API 호출만으로 보고, 듣고, 말하는 것과 관련된 인공지능 능력을 응용프로그램에 적용할 수 있다. 물론 마이크로소프트도 애저 코그너티브를 자사 제품에 활용한다. 애저 코그너티브는 음성, 언어, 비전, 앱서치 등의 인공지능 서비스를 인공지능에 관한 전문지식이 없는 개발자도 쉽게 사용할 수 있도록 API로 제공한다. (화면 : Microsoft) 이번에 발표한 마이크로소프트 365에서 ‘음성 명령으로 받아쓰기’와 웹 버전 워드(Word)에서 사용할 수 있는 ‘전사’ 기능은, 이러한 마이크로소프트 코그너티브 서비스와 연동해서 제공하는 기능이다. 음성 인식과 분석을...

2020.08.28

외국말 녹음하고 문자로 변환··· 구글 번역, 8개 국어 트랜스크라이브 지원

안드로이드 스마트폰에서 사용하는 구글 번역 기능이 한 단계 업그레이드된다. 안드로이드 구글 번역(Google Translate Android) 앱에서 음성으로 외국어를 녹음하고, 이를 원하는 언어의 문자로 변환할 수 있는 트랜스크라이브(Transcribe ; 받아쓰기) 기능을 지원하기 때문이다. 예를 들어 영어로 진행되는 회의나 강의 내용 전체를 녹음하면서, 이를 스페인어로 번역한 문장을 보는 것이 가능해진다. 현재 사용되는 스마트폰용 구글 번역 앱에서도 ‘음성’이나 ‘대화’ 모드를 이용하면, ‘음성’을 인식을 활용한 번역 서비스를 이용할 수 있다. 하지만 이 경우는 짧은 문장과 대화에만 사용할 수 있다. 트랜스크라이브는 사람의 목소리를 녹음하면서, 녹음되는 내용을 번역한 후 문자로 보여준다. 누군가 연설이나 강의를 하고 있다면, 실시간으로 음성을 녹음하고 이를 번역한 후, 선택한 언어의 문자로 변환해서 보여준다는 의미다. 안드로이드 구글 번역앱에서 트랜스크라이브 아이콘을 선택한 후, 소스아 대상 언어를 선택하면 트랜스크라이브 기능을 활용할 수 있다. 우선은 8개 언어만 지원하며, 다른 언어로 번역된 텍스트를 편하게 볼 수 있도록 문자 크기와 테마를 조정할 수 있다. (화면 : google blog) 트랜스크라이브 기능은 우선 안드로이드 버전의 구글 번역 앱에서만 사용할 수 있고, 새로운 앱은 조만간 출시할 예정이라고 구글은 밝혔다. 구글 플레이 스토어에서 트랜스크라이브 기능이 추가된 최신 앱이 등록되면, 다운로드받아 설치해서 사용하면 된다. 아이폰에서 사용할 수 있는 iOS 버전에 대해서는 아직 구체적으로 알려진 사실이 없다. 구글이 안드로이드와 iOS 버전의 앱을 출시할 때, 어느 정도 시차를 두었던 점을 고려하면, 아이폰용 버전도 기대볼 수 있을 것으로 전망된다. 다만, 현재는 사용 가능한 언어가 영어, 프랑스어, 독일어, 힌디어, 포르투갈어, 러시아어, 스페인어, 태국어 8가지로 제한된다. 트랜스크라이브 기능을 사용할 때는 앱 화면에서 트랜스크...

구글 번역 받아쓰기 옮겨쓰기 전사 트랜스크라이브

2020.03.19

안드로이드 스마트폰에서 사용하는 구글 번역 기능이 한 단계 업그레이드된다. 안드로이드 구글 번역(Google Translate Android) 앱에서 음성으로 외국어를 녹음하고, 이를 원하는 언어의 문자로 변환할 수 있는 트랜스크라이브(Transcribe ; 받아쓰기) 기능을 지원하기 때문이다. 예를 들어 영어로 진행되는 회의나 강의 내용 전체를 녹음하면서, 이를 스페인어로 번역한 문장을 보는 것이 가능해진다. 현재 사용되는 스마트폰용 구글 번역 앱에서도 ‘음성’이나 ‘대화’ 모드를 이용하면, ‘음성’을 인식을 활용한 번역 서비스를 이용할 수 있다. 하지만 이 경우는 짧은 문장과 대화에만 사용할 수 있다. 트랜스크라이브는 사람의 목소리를 녹음하면서, 녹음되는 내용을 번역한 후 문자로 보여준다. 누군가 연설이나 강의를 하고 있다면, 실시간으로 음성을 녹음하고 이를 번역한 후, 선택한 언어의 문자로 변환해서 보여준다는 의미다. 안드로이드 구글 번역앱에서 트랜스크라이브 아이콘을 선택한 후, 소스아 대상 언어를 선택하면 트랜스크라이브 기능을 활용할 수 있다. 우선은 8개 언어만 지원하며, 다른 언어로 번역된 텍스트를 편하게 볼 수 있도록 문자 크기와 테마를 조정할 수 있다. (화면 : google blog) 트랜스크라이브 기능은 우선 안드로이드 버전의 구글 번역 앱에서만 사용할 수 있고, 새로운 앱은 조만간 출시할 예정이라고 구글은 밝혔다. 구글 플레이 스토어에서 트랜스크라이브 기능이 추가된 최신 앱이 등록되면, 다운로드받아 설치해서 사용하면 된다. 아이폰에서 사용할 수 있는 iOS 버전에 대해서는 아직 구체적으로 알려진 사실이 없다. 구글이 안드로이드와 iOS 버전의 앱을 출시할 때, 어느 정도 시차를 두었던 점을 고려하면, 아이폰용 버전도 기대볼 수 있을 것으로 전망된다. 다만, 현재는 사용 가능한 언어가 영어, 프랑스어, 독일어, 힌디어, 포르투갈어, 러시아어, 스페인어, 태국어 8가지로 제한된다. 트랜스크라이브 기능을 사용할 때는 앱 화면에서 트랜스크...

2020.03.19

MS, 2020년 워드에 강력한 클라우드 받아쓰기 및 녹취 서비스 넣는다

마이크로소프트 워드의 받아쓰기 기능이 오랜만에 변화될 것으로 기대된다. 2017년 PCWorld는 윈도우 내의 받아쓰기 기능이 엉망이며, 특히 개인 사용자가 트레이닝이 필요한 로컬 모델에 기반한다는 점을 비판한 바 있다. 이제 마이크로소프트는 이보다 훨씬 강력한 클라우드 받아쓰기 기능을 워드에 2020년부터 도입한다고 전했다. 그리고 녹취 기능도 함께 들어간다. 워드를 열고 오른쪽 상단에 있는 마이크 버튼을 클릭하면 이 버튼의 역할을 알 수 있다. 모델을 훈련시키거나 깔끔하게 이야기하지 않으면 윈도우는 몇 가지 주요 단어만 알아들을 뿐이다. 아쉽게도 여기서 윈도우가 알아듣는 주요 단어는 충분하지 않으며, 계속 수정해야 하기 때문에 업무 생산성이 높지 않다.  한편, 또 다른 클라우드 서비스인 코타나를 사용해보면 정확도가 상당히 높다는 점을 알 수 있다. 마이크로소프트는 빌드(Build) 시연 등에서 코타나의 강력한 클라우드 기반 녹취 서비스를 자랑했는데, 성능이 상당히 놀랍다. 이것이 바로 마이크로소프트가 2020년 워드에 도입할 받아쓰기 및 녹취의 성능이다. 마이크로소프트는 원드라이브와 애저 스피치 서비스를 사용해 안전하게 오디오 파일을 보관할 것이라고 밝혔는데, 이것이 오피스 365 및 기업 버전의 마이크로소프트 365와 긴밀히 연결됨을 의미한다. 물론 무료는 아니다. 마이크로소프트는 “워드의 오디오 녹취 기능은 2020년 초 웹 버전 워드에 적용되며, 이어서 데스크톱용 워드와 모바일 앱에도 적용될 것이다. 정확한 계획과 가격은 출시가 다가오면 발표될 것”이라고 전했다. 녹음된 오디오 파일을 업로드해서 녹취를 만들 수 있는데 발화자마다 구분된다. 마이크로소프트는 블로그에서 녹취 내용이 워드에 사이드바로 표시되어 편집 중인 문서로 가져올 수 있다고 설명했다. 마이크로소프트가 GIF로 올린 시연에서는 모든 작업이 즉각적으로 이루어지지만, 실제 클라우드 녹취는 처리에 시간이 걸릴 것으로 예상된다.  마이크로소프트가 제공하는 녹취의 정...

워드 녹취 받아쓰기

2019.10.07

마이크로소프트 워드의 받아쓰기 기능이 오랜만에 변화될 것으로 기대된다. 2017년 PCWorld는 윈도우 내의 받아쓰기 기능이 엉망이며, 특히 개인 사용자가 트레이닝이 필요한 로컬 모델에 기반한다는 점을 비판한 바 있다. 이제 마이크로소프트는 이보다 훨씬 강력한 클라우드 받아쓰기 기능을 워드에 2020년부터 도입한다고 전했다. 그리고 녹취 기능도 함께 들어간다. 워드를 열고 오른쪽 상단에 있는 마이크 버튼을 클릭하면 이 버튼의 역할을 알 수 있다. 모델을 훈련시키거나 깔끔하게 이야기하지 않으면 윈도우는 몇 가지 주요 단어만 알아들을 뿐이다. 아쉽게도 여기서 윈도우가 알아듣는 주요 단어는 충분하지 않으며, 계속 수정해야 하기 때문에 업무 생산성이 높지 않다.  한편, 또 다른 클라우드 서비스인 코타나를 사용해보면 정확도가 상당히 높다는 점을 알 수 있다. 마이크로소프트는 빌드(Build) 시연 등에서 코타나의 강력한 클라우드 기반 녹취 서비스를 자랑했는데, 성능이 상당히 놀랍다. 이것이 바로 마이크로소프트가 2020년 워드에 도입할 받아쓰기 및 녹취의 성능이다. 마이크로소프트는 원드라이브와 애저 스피치 서비스를 사용해 안전하게 오디오 파일을 보관할 것이라고 밝혔는데, 이것이 오피스 365 및 기업 버전의 마이크로소프트 365와 긴밀히 연결됨을 의미한다. 물론 무료는 아니다. 마이크로소프트는 “워드의 오디오 녹취 기능은 2020년 초 웹 버전 워드에 적용되며, 이어서 데스크톱용 워드와 모바일 앱에도 적용될 것이다. 정확한 계획과 가격은 출시가 다가오면 발표될 것”이라고 전했다. 녹음된 오디오 파일을 업로드해서 녹취를 만들 수 있는데 발화자마다 구분된다. 마이크로소프트는 블로그에서 녹취 내용이 워드에 사이드바로 표시되어 편집 중인 문서로 가져올 수 있다고 설명했다. 마이크로소프트가 GIF로 올린 시연에서는 모든 작업이 즉각적으로 이루어지지만, 실제 클라우드 녹취는 처리에 시간이 걸릴 것으로 예상된다.  마이크로소프트가 제공하는 녹취의 정...

2019.10.07

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2023 International Data Group. All rights reserved.

10.5.0.9