此页面已由微软翻译机翻译服务自动翻译。 了解更多信息

微软翻译博客

新的 Microsoft 翻译自定义功能帮助为每个人释放人工智能的力量

今天, 我们正在改变公司如何通过利用我们的自动翻译方式 人工智能 专业技能, 使任何人能够快速、方便地自定义翻译系统, 即使没有大量以前翻译过的句子。此外, 随着更多数据的出现, 我们给您提供了逐步改进系统的机会。

我们正在进行这些更新, 因为每个公司都是独一无二的, 它的翻译需要也是如此。直到几年前, 自动翻译解决方案在翻译您的内容时只提供了两种方法-使用默认的翻译引擎来赋予主要翻译网站和应用程序, 如 Bing.com/translator, 或者从零开始痛苦地构建自己的自定义系统。

在 2012年, 微软翻译打破了这个僵化的模型, 推出了 自定义您的翻译.这只是一个更广泛的工作类的实例, 微软正在寻求围绕 人工智能, 以及我们对更多的个人计算体验和提高生产率的愿景, 这些系统越来越多地能够看到、听到、说、理解甚至开始推理。该中心允许用户根据需要创建尽可能多的自定义系统, 方法是将 microsoft 庞大的翻译语料库与他们自己以前翻译的文档 (如内部或外部网站、小册子、白皮书等) 结合起来。

目前, Microsoft 翻译 API 用户可以使用4个通用级别的定制, 资源投资和翻译质量相应增加。

  1. 新增: 使用标准类别而不是默认类别– 我们的新标准类别允许您通过缩小 microsoft 翻译人员用于翻译文本的统计分析范围, 轻松自定义翻译的上下文。简单地说, 使用标准类别, 您可以告诉 microsoft 翻译人员正在翻译的内容类型, 以提高其准确性。我们今天宣布的前两个标准类别是 "科技" 和 "演讲", 更多的是在路上。
    • "技术" 类别将提高所有计算机相关内容 (软件、硬件、网络...) 的翻译质量, 并且是在我们翻译产品帮助文件、文档时, 利用多年来在 microsoft 内部收集的大量数据构建的,和客户支持我们的用户, 以及来自其他来源, 如 TAUS.可以找到支持技术类别的语言列表 这里.
    • "语音" 类别是在过去18个月中开发的, 当时我们构建了 skype 翻译器。为了让 skype 翻译正常工作, 能够翻译口语文本是至关重要的, 在大多数情况下, 这可能与书面文本有很大的不同。此类别中支持的语言是相同的 语音翻译语言 可用于 Skype 翻译用于 iOS 和 Android 的微软翻译应用程序.随着这些应用程序发布新的语音语言, 相应的 "语音" 类别也将在我们的核心翻译 api 中用于文本翻译。

    在翻译中很容易开始使用标准类别-如果您使用的是 api, 则只需将翻译方法的 "类别" 参数的值设置为 "技术" 或 "语音", 或者在我们支持的任何产品中的 "类别 id" 框中 (如 Document Translator.默认值 "常规", 可以省略-只需选择新的标准类别即可开始接收自定义翻译。

    除了标准类别外, 我们还开发了一个 "社交媒体" 过滤器, 我们可以根据需要启用服务器端。这种客户端 id 级别筛选器的开发是为了将文本和即时消息转换为适当的英语, 以提高翻译质量。例如, 一旦通过过滤器, "你在这里吗?" 将变成 "你在这里吗?"--这显然会比原来的翻译得好得多。请注意, 目前只存在英语短信过滤器。

  2. 新建: 上传自定义词典– 您可以使用词典进一步自定义您的翻译。字典允许您制作自己的外语单词列表, 以便您的企业或行业独有的术语将按照您想要的方式进行翻译。例如, 如果您有一个产品名称, 您希望以某种方式翻译法语 (或根本不翻译, 如果它是一个品牌名称), 只需将产品名称和相应的法语翻译添加到您的词典中即可。每次使用 微软翻译 API 使用从翻译中心获得的自定义类别 ID, 您将获得自定义的翻译。要使您的翻译和运行, 所有您需要做的是上传一个简单的 Excel 电子表格与您的单词列表到 翻译中心网站 并对系统进行培训。你可以开始与一个字典条目一样少。您使用词典创建的自定义类别可以建立在一般或标准 (语音或技术) 类别的顶部, 即使在使用下列选项之一自定义系统时仍然有效。
  3. 新功能: 训练一个包含 1, 000–5, 000个并行句子的系统– 第三个级别的自定义是将预翻译的内容添加到您的自定义类别。今天, 我们正在引入培训一个只有 1 000个平行句子 (原文和目标语的预翻译句子) 的系统的能力。通过训练一个具有平行句子的系统, 你可以超越简单的翻译单词和短语列表。相反, 集线器对其所有内部参数进行调整, 以生成与您提供的测试句子类似的翻译。通过向中心提供至少 1, 000个平行句子, 您可以帮助集线器选择比标准类别更符合组织术语和色调的翻译。如果您以其他语言 (如网页或文档) 创建了内容, 则可以使用它来改进翻译。显然, 你的句子越多, 翻译就越好。您可以单独使用此自定义机制, 也可以与自定义词典结合使用。
  4. 训练一个包含超过 5, 000个平行句子的系统– 由于集线器已启动, 但现在开始只有5000句话, 而不是 1万, 你可以使用任何数量的平行句子5000以上, 以自定义您的翻译。有5000多个平行句子, 你可以开始创建一个系统, 学习新的术语和短语, 在正确的上下文和基调你的业务。这将导致更好、更个性化的翻译。如果你有一个少于5万个平行句子的语料库, 添加一本词典以获得更好的结果。如果你有5万多个平行句子, 你将能够建立一个系统, 可以提供完全定制的结果。在这个层次上, 机器通过并行的句子了解了你的术语, 所以字典将不那么有用, 当你在源内容中开发新的主题时, 它可以减少到新的术语。

在5万多个平行句子中, 理想的是在100s 的句子中, 中心使您能够创建全新的语言系统。许多 Microsoft 翻译支持的语言是由 社区合作伙伴 包括语言苗族, 尤卡坦玛雅, 克雷塔罗 Otomi, 威尔士和斯瓦希里语。

一旦您培训并部署了新的自定义系统, 就可以在所有类别的启用 ID 的 Microsoft 翻译产品中使用它, 例如, 在部署的版本中 Sharepoint、办公应用程序 幻灯片,在 Document Translator, 而该 多语言应用程序工具包, 以及许多翻译记忆工具, 从我们的 合作 伙伴.该集线器可以帮助提高翻译质量, 以便于多种情况, 如 网站本地化, 客户支持,以及 内部通信, 无论是在线还是应用。

要开始使用翻译中心自定义系统, 只需访问 www.microsoft.com/translator/hub.aspx, 并注册一个工作区。您可以邀请尽可能多的人加入您的工作区, 以协作改进翻译系统。当您准备好部署自定义系统时, 您将需要注册一个与 Microsoft 翻译公司的帐户。您可以注册一个 每月免费200万字符订阅 让你开始。注册后, 您可以到 翻译中心网站 开始自定义!

了解更多信息: