Offcanvas

������ ������

MS, 애저 기반 '문서 번역' 미리보기 출시 "원본 서식 및 포맷 유지"

마이크로소프트가 '문서 번역(Document Translation)' 서비스를 미리보기(preview) 형식으로 출시했다. 문서 번역은 클라우드 서비스인 애저(Azure) 기반의 기계 번역 서비스로, 애저 인지 서비스(Azure Cognitive Services) API 제품군의 일부지만, 현재는 단일 서비스인 변환기 리소스에서만 지원된다. 회사는 문서 구조와 데이터 형식을 그대로 유지하면서, 약 70개 이상의 언어로 문서를 번역할 수 있다고 설명했다. 문서 번역은 웹이나 앱에서 제공하는 페이지 또는 문장 형태의 번역과 달리, 다양한 형태의 파일을 대상으로 번역 작업을 진행한다. 번역 해야 할 문서가 많고 용량이 클 때, 전체 문서를 비동기적으로 번역하는 대용량 파일 번역이 가능하다. 번역할 문서를 한 번에 업로드 한 후 번역 작업을 진행할 수 있기 때문에 번역 업무의 효율을 높일 수 있다. 마이크로소프트가 클라우드 기반 '문서 번역' 서비스를 미리보기 형식으로 출시했다. '문서 번역'은 약 70개 이상의 언어로, 다양한 형식의 파일을, 일반 번역과 사용자 정의 용어집을 적용해 번역할 수 있다. (자료 : Microsoft) 번역 과정에서 원본 레이아웃과 형식을 최대한 유지하면서 파일을 번역하기 때문에, 번역 후 레이아웃을 다듬는 편집 과정을 최소화할 수 있는 것이 장점이다. 일반 텍스트나 HTML 형식으로 번역 파일을 저장하는 것도 가능하다. 파일 형식은 docx, pptx, txt, html, tab, xlf, msg, tmx, xlsx, pdf, tsv를 지원한다. 참고로 docx는 마이크로소프트 워드, pptx는 마이크로소프트 파워포인트, xlsx는 마이크로소프트 엑셀, msg는 마이크로소프트 아웃룩(Outlook) 내에서 생성 또는 저장된 이메일 메시지 파일이다. tsv와 tab는 스프레드시트에서 사용하는 탭으로 구분된 원시 데이터 파일, tmv는 CAT(Computer Aided Translation) 및 TM(Translation Memo...

문서 번역 마이크로소프트 기계 번역 애저

2021.02.22

마이크로소프트가 '문서 번역(Document Translation)' 서비스를 미리보기(preview) 형식으로 출시했다. 문서 번역은 클라우드 서비스인 애저(Azure) 기반의 기계 번역 서비스로, 애저 인지 서비스(Azure Cognitive Services) API 제품군의 일부지만, 현재는 단일 서비스인 변환기 리소스에서만 지원된다. 회사는 문서 구조와 데이터 형식을 그대로 유지하면서, 약 70개 이상의 언어로 문서를 번역할 수 있다고 설명했다. 문서 번역은 웹이나 앱에서 제공하는 페이지 또는 문장 형태의 번역과 달리, 다양한 형태의 파일을 대상으로 번역 작업을 진행한다. 번역 해야 할 문서가 많고 용량이 클 때, 전체 문서를 비동기적으로 번역하는 대용량 파일 번역이 가능하다. 번역할 문서를 한 번에 업로드 한 후 번역 작업을 진행할 수 있기 때문에 번역 업무의 효율을 높일 수 있다. 마이크로소프트가 클라우드 기반 '문서 번역' 서비스를 미리보기 형식으로 출시했다. '문서 번역'은 약 70개 이상의 언어로, 다양한 형식의 파일을, 일반 번역과 사용자 정의 용어집을 적용해 번역할 수 있다. (자료 : Microsoft) 번역 과정에서 원본 레이아웃과 형식을 최대한 유지하면서 파일을 번역하기 때문에, 번역 후 레이아웃을 다듬는 편집 과정을 최소화할 수 있는 것이 장점이다. 일반 텍스트나 HTML 형식으로 번역 파일을 저장하는 것도 가능하다. 파일 형식은 docx, pptx, txt, html, tab, xlf, msg, tmx, xlsx, pdf, tsv를 지원한다. 참고로 docx는 마이크로소프트 워드, pptx는 마이크로소프트 파워포인트, xlsx는 마이크로소프트 엑셀, msg는 마이크로소프트 아웃룩(Outlook) 내에서 생성 또는 저장된 이메일 메시지 파일이다. tsv와 tab는 스프레드시트에서 사용하는 탭으로 구분된 원시 데이터 파일, tmv는 CAT(Computer Aided Translation) 및 TM(Translation Memo...

2021.02.22

정의, 원리, 사례, SW, 교육과정으로 알아보는 '자연어처리(NLP)'

마치 사람이 하는 것처럼 컴퓨터가 사람의 언어를 이해하고 처리하며 생성할 수 있는 인공지능(AI)의 한 갈래인 자연어처리의 비즈니스 적용이 최근 급격하게 늘고 있다. NLP의 정의, 원리, 비즈니스 사례, 관련 소프트웨어 등을 알아보자.    정의 자연어처리(NLP)는 의사소통을 담당하는 인공지능(AI)의 한 갈래다. 어떻게 컴퓨터가 사람처럼 언어를 이해하고 처리하며 생성하도록 프로그래밍할 수 있을까? 이 용어는 본래 시스템이 읽을 수 있는 능력을 언급하기 위해 사용되었으나 모든 컴퓨터 언어를 이르는 구어적 표현이 되었다. 하위 카테고리에는 컴퓨터가 스스로 의사소통을 생성하는 능력인 자연어생성(NLG: natural language generation)과 속어, 잘못된 발음, 틀린 철자, 기타 언어의 변형을 이해하는 능력인 자연어이해(NLU: natural language understanding)가 포함된다. 작동 원리 NLP는 머신러닝을 통해 작동한다. 머신러닝 시스템은 단어 그리고 다른 형태의 데이터와 마찬가지로 단어가 합쳐지는 방식을 저장한다. 문구, 문장 그리고 때로는 책 전체가 머신러닝 엔진에 입력되고 문법 규칙, 사람들의 실제 언어 습관 등에 기초하여 처리된다. 그러면 컴퓨터가 이 데이터를 이용해 패턴을 찾고 그다음을 추론한다. 번역 소프트웨어를 예로 들어보자. 프랑스어로 ‘나는 공원에 가고 있다’는 ‘Je vais au parc’이기 때문에 머신러닝은 ‘나는 상점에 가고 있다’도 ‘Je vais au’로 시작하리라 예측한다. 그러면 컴퓨터는 ‘상점’이라는 단어만 있으면 된다. 적용 기계 번역은 개선된 NLP 적용 중 하나지만 가장 보편적으로 사용되지는 않는다. 검색이 보편적으로 사용된다. 구글이나 빙에서 무엇인가를 검색하면 데이터를 시스템에 입력하게 된다. 검색 결과를 클릭하면 시스템이 발견한 결과가 옳은 것이라는 확인으로 인식하고 이 정보를 추후 더 나은 검색을 위해 활용한다. 챗봇도 같은 방식으로 작동한다. 슬랙,...

CIO natural language generation natural language understanding NLTK SpaCy 구글 클라우드 트랜슬레이션 스페이시 아마존 컴프리렌드 자연어생성 자연어이해 젠심 IBM 왓슨 톤 애널라이저 Gensim 시리 인공지능 알렉사 챗봇 자연어처리 NLP NLG NLU 정서 분석 기계 번역 플레시먼힐러드

2020.03.18

마치 사람이 하는 것처럼 컴퓨터가 사람의 언어를 이해하고 처리하며 생성할 수 있는 인공지능(AI)의 한 갈래인 자연어처리의 비즈니스 적용이 최근 급격하게 늘고 있다. NLP의 정의, 원리, 비즈니스 사례, 관련 소프트웨어 등을 알아보자.    정의 자연어처리(NLP)는 의사소통을 담당하는 인공지능(AI)의 한 갈래다. 어떻게 컴퓨터가 사람처럼 언어를 이해하고 처리하며 생성하도록 프로그래밍할 수 있을까? 이 용어는 본래 시스템이 읽을 수 있는 능력을 언급하기 위해 사용되었으나 모든 컴퓨터 언어를 이르는 구어적 표현이 되었다. 하위 카테고리에는 컴퓨터가 스스로 의사소통을 생성하는 능력인 자연어생성(NLG: natural language generation)과 속어, 잘못된 발음, 틀린 철자, 기타 언어의 변형을 이해하는 능력인 자연어이해(NLU: natural language understanding)가 포함된다. 작동 원리 NLP는 머신러닝을 통해 작동한다. 머신러닝 시스템은 단어 그리고 다른 형태의 데이터와 마찬가지로 단어가 합쳐지는 방식을 저장한다. 문구, 문장 그리고 때로는 책 전체가 머신러닝 엔진에 입력되고 문법 규칙, 사람들의 실제 언어 습관 등에 기초하여 처리된다. 그러면 컴퓨터가 이 데이터를 이용해 패턴을 찾고 그다음을 추론한다. 번역 소프트웨어를 예로 들어보자. 프랑스어로 ‘나는 공원에 가고 있다’는 ‘Je vais au parc’이기 때문에 머신러닝은 ‘나는 상점에 가고 있다’도 ‘Je vais au’로 시작하리라 예측한다. 그러면 컴퓨터는 ‘상점’이라는 단어만 있으면 된다. 적용 기계 번역은 개선된 NLP 적용 중 하나지만 가장 보편적으로 사용되지는 않는다. 검색이 보편적으로 사용된다. 구글이나 빙에서 무엇인가를 검색하면 데이터를 시스템에 입력하게 된다. 검색 결과를 클릭하면 시스템이 발견한 결과가 옳은 것이라는 확인으로 인식하고 이 정보를 추후 더 나은 검색을 위해 활용한다. 챗봇도 같은 방식으로 작동한다. 슬랙,...

2020.03.18

구글 VP에 듣는 '검색의 미래, 투명성 제한, 음성 기술'

검색은 앞으로 어떻게 발전하며, 투명성 제한이 왜 필요하고, 음성 기반 검색이 어떤 영향을 끼칠까? 구글 글로벌 검색 담당 부사장이 내놓은 전망을 들어 보자.  “구글이 매일 소비자들에게 보여주는 공식 검색 결과는 궁극적으로 사회에서 해당 검색 대기업의 영향력과 역할에 대한 가장 투명한 점검 수단을 제공한다.” 이는 구글의 최고 검색 책임자가 한 말이다.  지난주 호주 시드니에서 열린 TwG(Think with Google) 행사에서 구글의 글로벌 검색 VP 판두 나약(사진)은 검색 기술의 미래와 인공지능(AI)의 역할에 대한 발표 세션에서 과도한 투명성에 대해 경고했다.  나약은 "검색 투명성이 과도하면 문제가 될 수 있다"고 경고했다. 그는 "알고리즘과 투명성을 과도하게 공개하면 스팸 전송자들에게만 도움이 될 뿐이다. 그들은 올바른 일을 하려는 고품질 웹사이트의 웹마스터들보다 더욱 효율이 높아질 것이다. 그리고 대부분 사용자가 피해를 받게 될 것이다"고 이야기했다.       이는 구글의 역사만 보아도 알 수 있다고 나약은 말했다. "검색 순위가 경제적인 가치를 나타나게 되면서 사람들이 시스템으로 게임을 하기 시작했다. 사용자를 위한 훌륭한 서비스와 콘텐츠를 구축하기보다는 사용자가 다른 것을 하도록 시스템을 만들기 시작했으며, 그중에는 악의적인 것도 있었다"고 그는 설명했다.  1999년 구글이 웹 페이지 내에서 링크의 중요성을 조작하는 페이지 순위 규칙에 대한 문서를 공개하자 발생한 일이 한 예다. 나약은 "링크를 속이는 스팸 전송자들도 존재한다"고 덧붙였다.  스팸 보호가 적용되지 않은 결과에 대한 구글의 연구에 따르면 웹 문서 중 40% 이상에 웹 전반에 걸친 인덱스 제공 스팸이 포함된 것으로 나타났다. 나약에 따르면, 이에 대응하는 자체 메커니즘으로 지난 3년 동안 ...

검색 사투리 기계 번역 음성 비서 음성 인터페이스 음성 검색 인공지능 스팸 CMO 번역 구글 자연어 검색

2019.02.19

검색은 앞으로 어떻게 발전하며, 투명성 제한이 왜 필요하고, 음성 기반 검색이 어떤 영향을 끼칠까? 구글 글로벌 검색 담당 부사장이 내놓은 전망을 들어 보자.  “구글이 매일 소비자들에게 보여주는 공식 검색 결과는 궁극적으로 사회에서 해당 검색 대기업의 영향력과 역할에 대한 가장 투명한 점검 수단을 제공한다.” 이는 구글의 최고 검색 책임자가 한 말이다.  지난주 호주 시드니에서 열린 TwG(Think with Google) 행사에서 구글의 글로벌 검색 VP 판두 나약(사진)은 검색 기술의 미래와 인공지능(AI)의 역할에 대한 발표 세션에서 과도한 투명성에 대해 경고했다.  나약은 "검색 투명성이 과도하면 문제가 될 수 있다"고 경고했다. 그는 "알고리즘과 투명성을 과도하게 공개하면 스팸 전송자들에게만 도움이 될 뿐이다. 그들은 올바른 일을 하려는 고품질 웹사이트의 웹마스터들보다 더욱 효율이 높아질 것이다. 그리고 대부분 사용자가 피해를 받게 될 것이다"고 이야기했다.       이는 구글의 역사만 보아도 알 수 있다고 나약은 말했다. "검색 순위가 경제적인 가치를 나타나게 되면서 사람들이 시스템으로 게임을 하기 시작했다. 사용자를 위한 훌륭한 서비스와 콘텐츠를 구축하기보다는 사용자가 다른 것을 하도록 시스템을 만들기 시작했으며, 그중에는 악의적인 것도 있었다"고 그는 설명했다.  1999년 구글이 웹 페이지 내에서 링크의 중요성을 조작하는 페이지 순위 규칙에 대한 문서를 공개하자 발생한 일이 한 예다. 나약은 "링크를 속이는 스팸 전송자들도 존재한다"고 덧붙였다.  스팸 보호가 적용되지 않은 결과에 대한 구글의 연구에 따르면 웹 문서 중 40% 이상에 웹 전반에 걸친 인덱스 제공 스팸이 포함된 것으로 나타났다. 나약에 따르면, 이에 대응하는 자체 메커니즘으로 지난 3년 동안 ...

2019.02.19

회사명:한국IDG 제호: ITWorld 주소 : 서울시 중구 세종대로 23, 4층 우)04512
등록번호 : 서울 아00743 등록일자 : 2009년 01월 19일

발행인 : 박형미 편집인 : 박재곤 청소년보호책임자 : 한정규
사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2022 International Data Group. All rights reserved.

10.4.0.13