Microsoft 翻译人员在其产品中加速使用神经网络
整整一年前,Microsoft Translator 向所有人提供了一种新的AI技术:神经机器翻译(NMT)。 .从那时起,团队一直在努力扩大 NMT 的使用范围,以改进 Microsoft Translator 文本和语音 API 以及所有 Microsoft Translator 支持的产品中的翻译。
今天,微软翻译家团队宣布了NMT技术的几项进展,无论你如何使用,都能让先进的AI翻译变得更加方便。
- 10种新的语言,现在在API和应用程序中都可以使用NMT的10种新语言。
- 现在所有的中文和印地语API流量都是由NMT提供的,开发者不需要做任何事情就可以使用。
- 新的 "混合型 "翻译可供API和应用程序用户使用,为NMT上还没有的语言带来了神经翻译的好处。
- 随着语音识别LSTM系统在语音API中发布语音识别LSTM系统,语音翻译端到端的技术已经开始发力了
- NMT现在也可以提供现场服务。
NMT技术改变了机器翻译,与现有的行业标准统计机器翻译(SMT)技术相比,NMT技术在翻译质量上取得了重大进步。NMT在翻译前能更好地捕捉到完整句子的上下文,提供更高的翻译质量和更人性化的输出。了解更多关于 NMT 如何工作 在微软翻译网站上, 观看下面的视频, 看看 nmt 是如何集成到微软翻译的语音翻译。
你可以在今天的NMT新动力翻译中尝试一下,在 Translator for Bing,在 微软翻译应用程序, Edge,在 翻译 PowerPoint 添加到, 当然,还有微软翻译器 文本 和 演讲 API。
介绍10种新的NMT授权语言
微软翻译器在其NMT系统列表中增加了10种新语言----现在有21种语言,而且还在不断增加!微软翻译器现在支持以下语言的翻译(NMT中的新语言)。NMT 现在支持以下语言的翻译(新的语言为 大胆).
阿拉伯语
保加利亚语 中文 捷克语 丹麦语 荷兰语 英语 |
法语
德语 印地语 意大利语 日语 朝鲜语 挪威语 |
波兰语
葡萄牙语 罗马尼亚 俄语 西班牙语 瑞典语 Turkish |
100%的中文和印地语翻译搬到了NMT
微软正在为开发者提供更多的NTM功能。具体来说,所有的中文和印地语翻译到英文,现在都默认使用我们新的NMT系统。 这意味着开发人员不需要在他们的应用程序中调用 "generalnn "类别,就可以从这些新系统中受益。对于其他语言来说,这个类别仍然需要,但在未来几周和几个月内,额外的语言将被转换为100%的NMT。
对于那些希望暂时继续使用SMT系统的开发者来说,例如,如果他们已经建立了海关系统,使用了 枢纽, 可以在调用 API 时使用 "SMT" 类别。
"混合型 "神经/统计翻译
在混合翻译中,当你所翻译的两种语言中只有一种语言是由NMT驱动的时候,你仍然会看到翻译质量的提高。
由于语言之间的可用训练数据的稀缺性,以及为每一对语言构建和运行专用系统的指数级复杂性,机器翻译系统将英语作为 "支点语言",从一种语言翻译到另一种语言。这意味着,每次要求机器翻译系统将中文翻译成西班牙语等语言时,翻译系统通常会先将中文翻译成英文,然后再将英文翻译成西班牙语。
使用混合翻译,当两种语言中至少有一种语言有可用的NMT系统时,Microsoft Translator会自动使用NMT来完成该部分的翻译。这一部分的翻译将得到改进,使整个翻译效果更好。请查看我们在微软支持论坛上的文章 了解有关混合翻译的更多信息.
端到端的LSTM神经网络驱动的语音翻译,显著提高语音翻译质量
语音识别正向高级化发展 LSTM 神经网络架构。结合可用语音数据的增加,LSTM语音识别提高了语音识别的质量(通过行业标准的"单词错误率"),最高可达29%,这取决于语言的不同。这对机器翻译的质量有直接影响,因为语音识别的准确度越高,得出的翻译结果就越准确。
Microsoft Translator的NMT使用LSTM技术,因此,现在的语音翻译从头到尾都在使用LSTM技术。试着用 Microsoft Translator 实时功能的 LSTM 语音翻译端到端的语音翻译功能。 翻译 PowerPoint 添加到,关于 http://translate.it 和 微软翻译应用程序Ĥ,或在 翻译语音 API.
处所神经网络
对于需要额外数据安全的企业来说,神经网络翻译现在也可以使用企业自己的服务器而不是微软Azure云服务,作为驻地服务提供。了解更多有关 微软翻译公司的前提下提供.