Microsoft Custom Translator rapproche la barre de qualité de la traduction de la parité humaine
Le voyage custom translator pour être à la fine pointe de la technologie de traduction automatique se poursuit.
Au début du mois d’août 2020, nous avons commencé notre mise à niveau Custom Translator, qui est passée de l’architecture de traduction automatique neuronale basée sur la mémoire à court terme (aka LSTM) (ou V1) à l’architecture de transformation à la fine pointe de la technologie (ou V2) de notre Microsoft Translator. V2 est la même architecture de traduction qui alimente l’API de traducteur noncussée standard, ainsi que la traduction dans Microsoft Office 365, Speech, Bing.com/translator, Edge, et plus encore.
La version d’août a permis aux clients d’utiliser Dictionary (phrase ou phrase) type de document pour construire des modèles personnalisés sur le dessus de la plate-forme V2 pour une amélioration rapide de la qualité de traduction sur la plate-forme V1.
Aujourd’hui, Custom Translator a terminé la mise à niveau complète de la plate-forme V2 pour offrir un gain de qualité de traduction encore plus important qu’auparavant. Les clients peuvent désormais créer des modèles personnalisés avec tous les types de documents (Formation, Testing, Tuning, Phrase Dictionary et Phrase Dictionary) à l’aide de documents en texte intégral, comme les documents Office, les PDF, le HTML et le texte brut.
Avec cette version, les entreprises, les petites et moyennes entreprises, les développeurs d’applications et les fournisseurs de services linguistiques peuvent créer des systèmes de traduction neuronales personnalisés avancés qui respectent leur terminologie commerciale définie et intègrent de façon transparente ces systèmes dans des applications, des flux de travail et des sites Web existants ou nouveaux afin d’attirer des clients et de faire croître l’entreprise.
Nous mettons chaque nouveau modèle de langue de base à travers un processus rigoureux d’évaluation humaine pour nous assurer que la qualité de la traduction continue de répondre à des normes élevées en matière d’entrée générique dans tous les domaines. Toutefois, grâce à des systèmes de traduction spécialisés formés sur mesure, les clients peuvent obtenir une plus grande adhésion à la terminologie et au style spécifiques au domaine en formant un système de traduction personnalisé sur des documents précédemment traduits dans le domaine. Ces documents traduits précédemment permettent à Custom Translator d’apprendre les traductions préférées dans leur contexte, de sorte que le traducteur peut appliquer ces termes et expressions lorsque le contexte l’exige, et produire une traduction couramment dans la langue cible, en respectant la grammaire dépendante du contexte de la langue cible.
Avantages de la mise à niveau
Nous utilisons Score bleu (une façon standard dans le milieu de la recherche) de mesurer la qualité de traduction d’un modèle de base nouvellement formé. Un ou deux points BLEU est une réalisation digne. La mise à niveau de la plate-forme Custom Translator V2 apportera des améliorations significatives par rapport à la plate-forme V1 précédente. Le graphique à barres ci-dessous décrit l’amélioration des scores BLEU de qualité de traduction pour certains domaines et l’impact de la taille du jeu de données de formation.
Exemples de qualité de traduction de domaines score BLEU lors de l’utilisation de Traducteur standard, Traducteur personnalisé V1 et Traducteur personnalisé V2.
Taille de l’ensemble de données de formation en milliers (« auto-28k » signifie 28.000 phrases parallèles pour le domaine automobile)
Il est important de noter que l’amélioration réelle de la qualité dépend de la qualité des données clients, de la taille du jeu de données de formation et de la couverture du domaine.
« Nous espérons que la traduction par le biais d’un réseau neuronal permettra non seulement d’accroître la qualité et la rapidité, mais aussi d’offrir des progrès dans l’évaluation du Big Data », a déclaré Nikolas Meyer-Aun, responsable de la qualité et de la gestion des fournisseurs pour les langues chez Volkswagen AG
Custom Translator offrira une mise à niveau gratuite vers V2. Vous pouvez recycler un modèle par projet dans un espace de travail vers la plate-forme V2 sans frais. Lorsque vous affichez un projet, vous devez voir un message si vous avez toujours un crédit de mise à niveau gratuit pour ce projet. L’offre commence aujourd’hui et se termine le 31 janvier 2021. Après le 31 janvier 2021, des frais de formation normaux s’appliquent pour chaque recyclage.
Vous pouvez en savoir plus sur la mise à niveau vers la version 2 dans la FAQ ci-dessous.
FAQ
- Qu’est-ce que vous relâchez en V2?
Nous publions une mise à niveau de la plate-forme Custom Translator (V2) pour apporter des améliorations significatives de la qualité de la traduction en utilisant l’architecture de traduction automatique neuronale de pointe de Microsoft. L’expérience utilisateur reste la même qu’en V1. Il n’y a rien de nouveau à apprendre, juste de meilleures traductions. Pour une mise à jour rapide, s’il vous plaît regarder cette Quick-Start vidéo sur YouTube. - Quel est l’avantage de la mise à niveau d’un modèle actuellement déployé sur la plate-forme V2 ?
Amélioration significative de la qualité de la traduction; la mise à niveau de la plate-forme Custom Translator V2 apportera une amélioration significative par rapport à la norme Translator et à la plate-forme V1 précédente. Le graphique à barres ci-dessus montre les scores BLEU de qualité de traduction pour certains domaines communs et l’impact de la taille du jeu de données de formation. - Comment puis-je utiliser ma mise à niveau GRATUITE vers le crédit V2 ?
Lorsque vous affichez les détails d’un projet, un message de crédit gratuit devient visible (voir les images ci-dessous) et continuera d’être visible jusqu’à ce que vous réformiez avec succès un modèle ou que l’offre se termine le 31 janvier 2021. - Comment mettre à niveau mes modèles personnalisés déployés (ou non déployés) vers la plate-forme V2 ?
Si vous disposez d’un modèle de dictionnaire déployé ou non déployé qui a été reformé après le 3 août 2020, il a déjà été mis à niveau vers la plate-forme V2. Sinon, vous devriez lancer une nouvelle formation de modèle. Une fois que le nouveau modèle est formé avec succès, le bouton « pchang » sera visible. Cliquez sur « Swap » pour déployer le nouveau modèle. Remarque : le bouton « Swap » permet le déploiement sans temps d’arrêt. Autrement dit, toutes les demandes de traduction continueront d’être servies par le modèle précédent jusqu’à ce que le nouveau modèle soit déployé et fonctionnel, puis le nouveau modèle servira de nouvelles demandes de traduction et le modèle précédent ne sera pas exploité. - Puis-je continuer à re-déployer des modèles personnalisés V1 après la mise à niveau de la plate-forme V2 ?
Oui. Nous comprenons qu’il peut y avoir des raisons pour lesquelles les clients voudraient continuer à utiliser des modèles formés sur la plate-forme V1. Les modèles V1 peuvent fonctionner sur la plate-forme V2. À l’avenir, les modèles V1 ne seront pas re-déployables. Remarque : Une fois que vous reformez un modèle V1, le nouveau modèle sera sur la plate-forme V2. L’onglet « Odèl » affichera tous les nouveaux modèles (V2) et précédents (V1). - Je suis nouveau sur la personnalisation des traductions, comment puis-je commencer à utiliser Custom Translator ?
Pour créer un modèle personnalisé, regardez la vidéo Quick-Start ci-dessus et reportez-vous à la documentation sur docs.microsoft.com : https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
Ce que vous pouvez faire avec Microsoft Custom Translator
Créez des modèles personnalisés avec votre terminologie spécifique à votre domaine et traduisez en temps réel à l’aide de l’API Microsoft Translator.
Utilisez Microsoft Custom Translator avec vos solutions de traduction pour aider à mondialiser votre entreprise et à améliorer les interactions avec les clients.
Pour plus d’informations sur les solutions Microsoft Translator, veuillez consulter : https://www.microsoft.com/translator/business.