マイクロソフトのカスタムトランスレータは、翻訳品質バーを人間の平価に近づける
機械翻訳技術の最先端を行くCustom Translatorの旅は続きます。
2020年8月初旬に、Custom Translatorのロングショートメモリ(別名LSTM)ベースのニューラル機械翻訳アーキテクチャ(またはV1)から、Microsoft Translatorの最先端のTranslatorベースのアーキテクチャ(またはV2)へのアップグレードを開始しました。V2は、Microsoft Office 365、Speech、Bing.com/translator、Edgeなどでの翻訳だけでなく、標準の未カスタマイズのTranslator APIにも力を与える同じ翻訳アーキテクチャです。
8月のリリースでは、顧客は じしょ (フレーズや文)のドキュメントタイプで、V2プラットフォームの上にカスタムモデルを構築し、V1プラットフォームよりも迅速に翻訳品質を向上させることができます。
今日、Custom Translatorは完全なV2プラットフォームのアップグレードを完了し、以前よりもさらに大きな翻訳品質のゲインを提供しました。顧客は今、Office文書、PDF、HTMLおよびプレーンテキストのようなフルテキスト文書を使用して、すべての文書タイプ(トレーニング、テスト、チューニング、句辞書および文辞書)でカスタムモデルを構築することができます。
このリリースにより、企業、中小企業、アプリ開発者、言語サービスプロバイダは、定義されたビジネス用語を尊重した高度なカスタムニューラル翻訳システムを構築し、それらのシステムを既存または新規のアプリケーション、ワークフロー、Webサイトにシームレスに統合して、顧客を惹きつけ、ビジネスを成長させることができます。
当社では、すべての新しいベースライン言語モデルに厳格な人間評価プロセスを適用し、翻訳品質がすべてのドメインで一般的な入力に対して高い基準を満たし続けていることを確認しています。しかし、カスタムトレーニングされた専門翻訳システムでは、以前に翻訳されたドメイン内の文書でカスタム翻訳システムをトレーニングすることで、お客様はドメイン固有の用語とスタイルへのより高い準拠を達成することができます。これらの以前に翻訳された文書は、カスタム翻訳者が文脈で好ましい翻訳を学習することを可能にしますので、翻訳者は、文脈が必要とするときにこれらの用語とフレーズを適用し、ターゲット言語の文脈依存の文法を尊重して、ターゲット言語で流暢な翻訳を作成することができます。
アップグレードのメリット
私たちは ブルースコア (研究コミュニティでは標準的な方法)で、新しく訓練されたベースラインモデルの翻訳品質を測定することができます。1~2点のBLEUポイントの獲得は価値のある成果です。Custom Translator V2プラットフォームのアップグレードは、以前のV1プラットフォームと比較すると、大幅な改善をもたらします。下の棒グラフは、いくつかのドメインの翻訳品質BLEUスコアの改善と、トレーニングデータセットサイズの影響を示しています。
標準Translator、Custom Translator V1、Custom Translator V2を使用した場合のサンプルドメイン翻訳品質BLEUスコア。
学習データセットのサイズ(数千単位)(「auto-28k」は自動車領域で28,000個の並列文を意味する
実際の品質向上は、顧客データの品質、トレーニングデータセットのサイズ、ドメインカバレッジに依存することに注意してください。
"ニューラルネットワークを介した翻訳は、品質とスピードを向上させるだけでなく、ビッグデータの評価の進歩にもつながると期待しています。" フォルクスワーゲンAGの品質・サプライヤー管理責任者であるNikolas Meyer-Aun氏は次のように述べています。
Custom Translatorは無料でV2へのアップグレードを提供します。ワークスペース内のプロジェクトごとに1つのモデルをV2プラットフォームに無料で再トレーニングすることができます。プロジェクトを表示すると、そのプロジェクトの無料アップグレードクレジットが残っているかどうかのメッセージが表示されるはずです。このオファーは本日から開始され、2021年1月31日までです。2021年1月31日以降は、再トレーニングのたびに通常のトレーニング料金が適用されます。
バージョン2へのアップグレードについては、以下のFAQをご覧ください。
FAQ
- V2で何をリリースするの?
マイクロソフトの最先端のニューラル機械翻訳アーキテクチャを使用した翻訳品質の大幅な向上を実現するCustom Translatorプラットフォームのアップグレード(V2)をリリースします。ユーザー体験はV1と同じです。新しいことは何もありません。簡単な復習は、こちらをご覧ください。 YouTubeのクイックスタート動画. - 現在配備されているモデルをV2プラットフォームにアップグレードするメリットは何ですか?
翻訳品質の大幅な改善:Custom Translator V2プラットフォームのアップグレードは、標準のTranslatorや以前のV1プラットフォームよりも大幅に改善されます。上の棒グラフは、いくつかの共通ドメインの翻訳品質BLEUスコアとトレーニングデータセットサイズの影響を示しています。 - V2クレジットへの無料アップグレードを利用するにはどうすればいいですか?
プロジェクトの詳細を表示すると、無料のクレジットメッセージが表示され(下の画像を参照)、モデルの再トレーニングに成功するか、2021年1月31日にオファーが終了するまで表示され続けます。 - デプロイした(またはデプロイしていない)カスタムモデルをV2プラットフォームにアップグレードするにはどうすればいいですか?
2020年8月3日以降に再訓練を実施した辞書専用機種が配備されている場合は、すでにV2プラットフォームにアップグレードされています。それ以外の場合は、新機種のトレーニングを開始する必要があります。新モデルのトレーニングに成功すると、「Swap」ボタンが表示されます。Swap」をクリックして、新しいモデルを展開します。注: "Swap"ボタンは、ダウンタイムなしのデプロイを可能にします。つまり、新しいモデルがデプロイされて機能するまで、すべての翻訳要求は前のモデルによって提供され続け、その後、新しいモデルは新しい翻訳要求を提供し、前のモデルはアンデプロイされます。 - V2プラットフォームのアップグレード後もV1カスタムモデルの再展開は可能ですか?
承知しておりますお客様がV1プラットフォームで学習したモデルを継続して使用したい理由があると理解しています。V1モデルはV2プラットフォーム上で動作します。将来的には、V1モデルは再配備できなくなります。注:V1モデルを再トレーニングすると、新しいモデルはV2プラットフォーム上で動作します。モデル」タブには、新しい(V2)モデルと以前の(V1)モデルがすべて表示されます。 - 私は翻訳をカスタマイズするのは初めてですが、どのように私はカスタムトランスレータを使用して開始することができますか?
カスタムモデルを作成するには、上記のクイックスタートビデオを見て、docs.microsoft.comのドキュメントを参照してください。 https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
Microsoft Custom Translatorでできること
ドメイン固有の用語でカスタムモデルを構築し、Microsoft Translator APIを使用してリアルタイムに翻訳します。
Microsoft Custom Translatorを翻訳ソリューションと一緒に使用することで、ビジネスのグローバル化と顧客とのやり取りの改善に役立ちます。
Microsoft Translatorソリューションの詳細については、こちらをご覧ください。 https://www.microsoft.com/translator/business.