微软自定义翻译器推动翻译质量门槛更接近人类的平等性
自定义翻译公司走在机器翻译技术前沿的旅程还在继续。
2020年8月初,我们开始将我们的定制翻译器从基于长短期记忆(又称LSTM)的神经机器翻译架构(或V1)升级到我们微软翻译器最先进的基于Transformer的架构(或V2)。V2是相同的翻译架构,它为标准的非定制翻译器API提供动力,以及在Microsoft Office 365、Speech、Bing.com/translator、Edge等中进行翻译。
8月份的版本使客户能够使用 词典 (短语或句子)文档类型,在V2平台之上建立自定义模型,比V1平台快速提升翻译质量。
今天,Custom Translator完成了V2平台的全面升级,实现了比之前更大的翻译质量提升。客户现在可以使用全文本文档(如Office文档、PDF、HTML和纯文本)建立所有文档类型(培训、测试、调校、短语词典和句子词典)的自定义模型。
通过该版本,企业、中小型企业、应用开发商和语言服务提供商可以构建先进的自定义神经翻译系统,尊重他们定义的业务术语,并将这些系统无缝集成到现有或新的应用程序、工作流和网站中,以吸引客户并发展业务。
我们将每一个新的基线语言模型都经过严格的人工评估过程,以确保翻译质量在所有领域的通用输入上持续达到高标准。然而,对于经过定制训练的专业翻译系统,客户可以通过在以前翻译过的域内文档上训练定制翻译系统,实现对特定领域术语和风格的更高坚持。这些先前翻译过的文档使定制翻译系统能够在上下文中学习首选的翻译,因此翻译系统可以在上下文需要时应用这些术语和短语,并在尊重目标语言的上下文依赖性语法的情况下,用目标语言产生流畅的翻译。
升级的好处
我们使用 BLEU 评分 研究界的一种标准方式)来衡量新训练的基线模型的翻译质量。一到两个BLEU点的提升是一个值得肯定的成绩。与之前的V1平台相比,Custom Translator V2平台升级将带来显著的改进。下面的柱状图描述了一些领域的翻译质量BLEU分的提升,以及训练数据集大小的影响。
使用标准翻译器、自定义翻译器V1和自定义翻译器V2时,样本域翻译质量BLEU得分。
训练数据集大小,以千为单位('auto-28k'指汽车领域的28000个平行句子)。
需要注意的是,实际质量的提升取决于客户数据质量、训练数据集大小和领域覆盖率。
"我们希望通过神经网络进行翻译,不仅能提升质量和速度,还能为大数据的评估提供进步"。 大众汽车公司语言质量和供应商管理负责人Nikolas Meyer-Aun说。
Custom Translator将提供免费升级到V2。您可以在一个工作区的每个项目中重新训练一个模型到V2平台,不收取任何费用。当您查看一个项目时,您应该看到一条消息,如果您仍然有该项目的免费升级信用。该优惠从今天开始,到2021年1月31日结束。2021年1月31日之后,每次再培训都要收取正常的培训费用。
你可以在下面的FAQ中了解更多关于升级到第2版的信息。
常见问题
- 你们在V2中发布了什么?
我们正在发布Custom Translator平台升级版(V2),使用微软最先进的神经机器翻译架构,提供显著的翻译质量改进。用户体验与V1保持一致。没有什么新的东西需要学习,只是更好的翻译。如需快速复习,请观看以下内容 YouTube上的快速入门视频. - 将当前部署的机型升级到V2平台有什么好处?
翻译质量显著提升;自定义翻译器V2平台升级后,将比标准翻译器和之前的V1平台有显著提升。上面的柱状图显示了一些常见领域的翻译质量BLEU分数以及训练数据集大小的影响。 - 如何使用我的免费升级到V2积分?
当您查看项目详情时,一条免费的信用信息就会显现出来(见下图),并将持续显现,直到您成功地重新培训了一个模型或优惠于2021年1月31日结束。 - 如何将已部署(或未部署)的自定义模型升级到V2平台?
如果您有一个已部署或未部署的仅有字典的模型,并在2020年8月3日之后重新训练,它已经升级到V2平台。否则,您应该启动新的模型训练。新模型训练成功后,将看到"交换"按钮。点击"交换",部署新模型。注意:"交换"按钮可实现无停机部署。即所有翻译请求将继续由前一个模型提供服务,直到新模型部署完毕并投入使用,然后新模型将为新的翻译请求提供服务,前一个模型将不被部署。 - V2平台升级后,还能继续重新部署V1自定义模型吗?
是的,我们理解客户可能有理由希望继续使用在V1平台上训练的模型。我们理解客户可能有理由希望继续使用在V1平台上训练的模型。V1模型可以在V2平台上运行。在未来,V1模型将无法重新部署。注意:一旦您重新训练V1模型,新模型将在V2平台上。"模型"选项卡将显示所有新的(V2)和以前的(V1)模型。 - 我是自定义翻译的新手,如何开始使用自定义翻译器?
要建立自定义模型,请观看上面的快速入门视频,并参考docs.microsoft.com上的文档。 https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
你可以用Microsoft Custom Translator做什么
使用您的领域特定术语构建自定义模型,并使用 Microsoft Translator API 进行实时翻译。
使用 Microsoft Custom Translator 和您的翻译解决方案来帮助您的业务全球化并改善客户互动。
有关Microsoft Translator解决方案的更多信息,请访问。 https://www.microsoft.com/translator/business.