마이크로 소프트 번역기는 자사의 오퍼링에 걸쳐 신경망의 사용을 가속
정확히 1 년 전, 마이크로 소프트 번역기 모든 사람이 사용할 수 있는 새로운 AI 기반 기술: 신경기계 번역(NMT) . 그 이후로 팀은 Microsoft 번역기 텍스트 및 음성 API뿐만 아니라 모든 Microsoft 번역기 지원 제품에서 번역을 개선하기 위해 NMT 사용을 확장하기 위해 열심히 노력하고 있습니다.
현재 Microsoft 번역기 팀은 NMT 기술의 여러 개발 을 발표하여 고급 AI 번역을 사용하는 방법에 관계없이 보다 쉽게 액세스할 수 있도록 하고 있습니다.
- 이제 API와 앱 모두에서 NMT에 10개의 새 언어를 사용할 수 있습니다.
- 중국어와 힌디어의 모든 API 트래픽은 이제 NMT에 의해 구동되며, 개발자는 그것을 사용하기 위해 아무것도 할 필요가 없습니다
- 새로운 "하이브리드" 번역은 API 및 앱 사용자 모두에게 제공되어 NMT에서 아직 사용할 수 없는 언어로 신경 번역의 이점을 제공합니다.
- 음성 변환은 이제 음성 API에서 음성 인식 LSTM 시스템을 릴리스하여 LSTM 기술로 끝까지 구동됩니다.
- NMT는 이제 온프레미스 서비스로도 사용할 수 있습니다.
NMT 기술은 기계 번역을 혁신하여 기존 산업 표준 통계 기계 번역(SMT) 기술을 통해 번역 품질에 큰 진보를 제공했습니다. NMT는 번역하기 전에 전체 문장의 컨텍스트를 더 잘 캡처하여 훨씬 더 높은 품질의 번역과 더 많은 인간사운드 출력을 제공합니다. 자세히 알아보기 NMT는 어떻게 작동 microsoft 번역기 웹 사이트에서 nmt가 microsoft 번역기의 음성 번역에 통합 되는 방법을 보려면 아래 비디오를 시청 하십시오.
오늘 새로운 NMT 전원 번역을 사용해 볼 수 있습니다. 빙에 대 한 번역, 마이크로 소프트 번역기 애플 리 케이 션, 가장자리, 번역기 파워 포인트 추가물론, 마이크로소프트 번역기 텍스트 그리고 음성 Api.
10개의 새로운 NMT 기반 언어 소개
Microsoft 번역기는 NMT 시스템 목록에 10개의 새로운 언어를 추가하여 현재 21개 언어로 성장하고 있습니다! NMT는 이제 다음 언어로 번역을 강화합니다(새 언어는 굵게).
아랍어
불가리어 중국어 체코어 덴마크어 네덜란드어 영어 |
프랑스어
독일어 힌디어 이탈리아어 일본어 한국어 노르웨이어 |
폴란드어
포르투갈어 루마니아어 러시아어 스페인어 스웨덴어 turkish |
중국어 및 힌디어 번역의 100% NMT로 이전
Microsoft는 개발자가 NTM을 보다 쉽게 사용할 수 있도록 하고 있습니다. 특히, 영어와 힌디어의 모든 번역은 이제 기본적으로 새로운 NMT 시스템을 사용하고 있습니다. 즉, 개발자는 이러한 새 시스템의 이점을 누리기 위해 앱에서 "generalnn" 범주를 호출할 필요가 없습니다. 다른 언어의 경우 이 범주는 여전히 필요하지만 향후 몇 주 및 몇 달 내에 추가 언어가 100% NMT로 전환됩니다.
당분간 SMT 시스템을 계속 사용하려는 개발자의 경우, 예를 들어, 세관 시스템을 구축한 경우 허브API를 호출할 때 "SMT" 범주를 사용할 수 있습니다.
"하이브리드" 신경/통계 번역
하이브리드 번역을 사용하면 번역하는 두 언어 중 하나만 NMT 기반이 면 번역 품질이 향상됩니다.
언어 간 사용 가능한 교육 데이터가 부족하고 각 언어 쌍에 대한 전용 시스템을 구축하고 실행하는 것이 기하급수적으로 복잡하기 때문에 기계 번역 시스템은 영어를 "피벗 언어"로 사용하여 한 언어에서 다른. 즉, 중국어에서 스페인어로 번역할 수 있는 기계 번역 시스템을 요청할 때마다 번역 시스템은 일반적으로 중국어를 영어로 번역한 다음 영어를 스페인어로 번역합니다.
하이브리드 번역을 사용하면 두 언어 중 하나 이상이 사용 가능한 NMT 시스템을 사용하는 경우 Microsoft 번역기는 번역의 해당 섹션에 NMT를 자동으로 사용합니다. 번역의 이 부분은 개선되어 전체 번역이 개선됩니다. Microsoft 지원 포럼에서 문서를 보려면 하이브리드 번역에 대해 자세히 알아보기.
음성 번역 품질을 획기적으로 개선하기 위한 엔드 투 엔드 LSTM 신경망 기반 음성 변환
음성 인식이 고급으로 전환되고 있습니다. lstm 신경망 아키텍처를 구성할 수 있습니다. 사용 가능한 음성 데이터의 증가와 함께 LSTM 음성 인식은 품질을 향상시킵니다(업계 표준에 의해 측정)단어 오류율") 언어에 따라 최대 29%. 이는 음성 인식이 정확할수록 결과 변환이 더 정확하기 때문에 기계 번역품질에 직접적인 영향을 미칩니다.
마이크로소프트 번역기의 NMT는 LSTM 기술을 사용 하 여- 음성 번역 은 이제 처음부터 끝까지 LSTM 기술을 사용 하 고 있습니다. Microsoft 번역기 라이브 기능을 사용하여 LSTM 음성 번역 기능을 끝까지 사용해 보십시오. 번역기 파워 포인트 추가에 http://translate.it 그리고 그 마이크로 소프트 번역기 애플 리 케이 션또는 통역 음성 API.
온프레미스 신경망
추가 데이터 보안이 필요한 조직의 경우 이제 Microsoft Azure 클라우드 서비스가 아닌 조직의 자체 서버를 사용하여 온프레미스 서비스로 도사용할 수 있습니다. 자세히 알아보기 마이크로 소프트 번역기의 구내에 제공.
블로그에서 더 자세히 알아보기 마이크로소프트 리서치 그리고 인지 서비스.