2021.02.22

MS, 애저 기반 '문서 번역' 미리보기 출시 "원본 서식 및 포맷 유지"

김달훈 | CIO KR
마이크로소프트가 '문서 번역(Document Translation)' 서비스를 미리보기(preview) 형식으로 출시했다. 문서 번역은 클라우드 서비스인 애저(Azure) 기반의 기계 번역 서비스로, 애저 인지 서비스(Azure Cognitive Services) API 제품군의 일부지만, 현재는 단일 서비스인 변환기 리소스에서만 지원된다. 회사는 문서 구조와 데이터 형식을 그대로 유지하면서, 약 70개 이상의 언어로 문서를 번역할 수 있다고 설명했다.

문서 번역은 웹이나 앱에서 제공하는 페이지 또는 문장 형태의 번역과 달리, 다양한 형태의 파일을 대상으로 번역 작업을 진행한다. 번역 해야 할 문서가 많고 용량이 클 때, 전체 문서를 비동기적으로 번역하는 대용량 파일 번역이 가능하다. 번역할 문서를 한 번에 업로드 한 후 번역 작업을 진행할 수 있기 때문에 번역 업무의 효율을 높일 수 있다.


마이크로소프트가 클라우드 기반 '문서 번역' 서비스를 미리보기 형식으로 출시했다. '문서 번역'은 약 70개 이상의 언어로, 다양한 형식의 파일을, 일반 번역과 사용자 정의 용어집을 적용해 번역할 수 있다. (자료 : Microsoft)

번역 과정에서 원본 레이아웃과 형식을 최대한 유지하면서 파일을 번역하기 때문에, 번역 후 레이아웃을 다듬는 편집 과정을 최소화할 수 있는 것이 장점이다. 일반 텍스트나 HTML 형식으로 번역 파일을 저장하는 것도 가능하다. 파일 형식은 docx, pptx, txt, html, tab, xlf, msg, tmx, xlsx, pdf, tsv를 지원한다.

참고로 docx는 마이크로소프트 워드, pptx는 마이크로소프트 파워포인트, xlsx는 마이크로소프트 엑셀, msg는 마이크로소프트 아웃룩(Outlook) 내에서 생성 또는 저장된 이메일 메시지 파일이다. tsv와 tab는 스프레드시트에서 사용하는 탭으로 구분된 원시 데이터 파일, tmv는 CAT(Computer Aided Translation) 및 TM(Translation Memory)를 교환하는 데 사용하는 개방형 XML 표준이다.

특히, 사용자 지정 번역기나 사용자 정의 용어집을 활용할 수 있기 때문에, 기술 번역이나 전문 영역에 대한 번역 품질을 높일 수 있다. 사용자 정의 용어집에 특정 단어나 구문에 대한 의미를 해당 업계나 업무에서 사용하는 용어를 정의하고, 이를 업로드해서 번역 작업에 활용함으로써 번역의 정확성을 높일 수 있도록 했다.

문서 번역 서비스 이용은 먼저 애저 계정으로 로그인하는 것부터 시작한다. 로그인은 기존의 애저 계정을 활용하거나 없다면 먼저 계정을 만들어야 한다. 애저에 로그인하면 '애저 블랍 스토리지(Azure blob storage)'에 번역할 문서 파일을 업로드하고, 문서 번역 서비스에서 번역 요청을 한다. 파일에 대한 번역이 진행되는 동안 작업 상태를 모니터할 수 있고, 번역이 완료된 문서는 블랍 저장소에서 검색할 수 있다.

사용 요금은 번역한 글자 단위로 과금이 이루어지며, 일반 번역과 사용자 지정 번역 모델에 따라 가격이 달라진다. 일반 모델의 경우는 100만 자당 15달러(Pay-as-you-go – $15 per million characters)를 받는다. 사용자 지정 변역은 종량제만 이용할 경우 백만 자당 40달러를 내고, 정액제와 종량제를 결합한 C2, C3, C4 가격 모델을 선택하는 것도 가능하다.

한 달에 2,055달러인 C2 요금은 최대 6,250만 자까지 번역 할 수 있고, 이를 초과하면 100만 자당 32.88달러가 과금된다. 한 달에 6,000달러인 C3는 한 달에 최대 2억 5,000만 자 까지 번역할 수 있고, 이를 초과하면 100만 자당 24달러가 부과된다. C4의 경우는 한 달 요금 4만 5,000달러로 최대 25억 자까지 번역이 가능하고, 이를 초과하면 100만 자당 18달러를 받는다. ciokr@idg.co.kr



2021.02.22

MS, 애저 기반 '문서 번역' 미리보기 출시 "원본 서식 및 포맷 유지"

김달훈 | CIO KR
마이크로소프트가 '문서 번역(Document Translation)' 서비스를 미리보기(preview) 형식으로 출시했다. 문서 번역은 클라우드 서비스인 애저(Azure) 기반의 기계 번역 서비스로, 애저 인지 서비스(Azure Cognitive Services) API 제품군의 일부지만, 현재는 단일 서비스인 변환기 리소스에서만 지원된다. 회사는 문서 구조와 데이터 형식을 그대로 유지하면서, 약 70개 이상의 언어로 문서를 번역할 수 있다고 설명했다.

문서 번역은 웹이나 앱에서 제공하는 페이지 또는 문장 형태의 번역과 달리, 다양한 형태의 파일을 대상으로 번역 작업을 진행한다. 번역 해야 할 문서가 많고 용량이 클 때, 전체 문서를 비동기적으로 번역하는 대용량 파일 번역이 가능하다. 번역할 문서를 한 번에 업로드 한 후 번역 작업을 진행할 수 있기 때문에 번역 업무의 효율을 높일 수 있다.


마이크로소프트가 클라우드 기반 '문서 번역' 서비스를 미리보기 형식으로 출시했다. '문서 번역'은 약 70개 이상의 언어로, 다양한 형식의 파일을, 일반 번역과 사용자 정의 용어집을 적용해 번역할 수 있다. (자료 : Microsoft)

번역 과정에서 원본 레이아웃과 형식을 최대한 유지하면서 파일을 번역하기 때문에, 번역 후 레이아웃을 다듬는 편집 과정을 최소화할 수 있는 것이 장점이다. 일반 텍스트나 HTML 형식으로 번역 파일을 저장하는 것도 가능하다. 파일 형식은 docx, pptx, txt, html, tab, xlf, msg, tmx, xlsx, pdf, tsv를 지원한다.

참고로 docx는 마이크로소프트 워드, pptx는 마이크로소프트 파워포인트, xlsx는 마이크로소프트 엑셀, msg는 마이크로소프트 아웃룩(Outlook) 내에서 생성 또는 저장된 이메일 메시지 파일이다. tsv와 tab는 스프레드시트에서 사용하는 탭으로 구분된 원시 데이터 파일, tmv는 CAT(Computer Aided Translation) 및 TM(Translation Memory)를 교환하는 데 사용하는 개방형 XML 표준이다.

특히, 사용자 지정 번역기나 사용자 정의 용어집을 활용할 수 있기 때문에, 기술 번역이나 전문 영역에 대한 번역 품질을 높일 수 있다. 사용자 정의 용어집에 특정 단어나 구문에 대한 의미를 해당 업계나 업무에서 사용하는 용어를 정의하고, 이를 업로드해서 번역 작업에 활용함으로써 번역의 정확성을 높일 수 있도록 했다.

문서 번역 서비스 이용은 먼저 애저 계정으로 로그인하는 것부터 시작한다. 로그인은 기존의 애저 계정을 활용하거나 없다면 먼저 계정을 만들어야 한다. 애저에 로그인하면 '애저 블랍 스토리지(Azure blob storage)'에 번역할 문서 파일을 업로드하고, 문서 번역 서비스에서 번역 요청을 한다. 파일에 대한 번역이 진행되는 동안 작업 상태를 모니터할 수 있고, 번역이 완료된 문서는 블랍 저장소에서 검색할 수 있다.

사용 요금은 번역한 글자 단위로 과금이 이루어지며, 일반 번역과 사용자 지정 번역 모델에 따라 가격이 달라진다. 일반 모델의 경우는 100만 자당 15달러(Pay-as-you-go – $15 per million characters)를 받는다. 사용자 지정 변역은 종량제만 이용할 경우 백만 자당 40달러를 내고, 정액제와 종량제를 결합한 C2, C3, C4 가격 모델을 선택하는 것도 가능하다.

한 달에 2,055달러인 C2 요금은 최대 6,250만 자까지 번역 할 수 있고, 이를 초과하면 100만 자당 32.88달러가 과금된다. 한 달에 6,000달러인 C3는 한 달에 최대 2억 5,000만 자 까지 번역할 수 있고, 이를 초과하면 100만 자당 24달러가 부과된다. C4의 경우는 한 달 요금 4만 5,000달러로 최대 25억 자까지 번역이 가능하고, 이를 초과하면 100만 자당 18달러를 받는다. ciokr@idg.co.kr

X