Azure AI anpassad översättare neuralt lexikon: Högre kvalitet på terminologiöversättningar
Idag är vi mycket glada över att kunna presentera neural ordbok, en viktig förbättring av översättningskvaliteten på vår plattform. I det här blogginlägget kommer vi att utforska funktionen neuralt lexikon.
Inledning
Neural Dictionary är en förlängning av vår dynamisk ordbok Och fras ordbok funktioner i Azure AI Translator. Båda gör det möjligt för våra användare att anpassa översättningsresultatet genom att tillhandahålla egna översättningar för specifika termer eller fraser. Vår tidigare metod använde verbatim dictionary, som var en exakt hitta-och-ersätt-operation. Neural dictionary förbättrar översättningskvaliteten för meningar som kan innehålla en eller flera termöversättningar genom att låta maskinöversättningsmodellen justera både termen och kontexten för att producera en mer flytande översättning. Samtidigt bevaras den höga precisionen i termöversättningen.
Följande engelsk-tyska exempel visar skillnaderna i översättningsresultat mellan de båda metoderna när en anpassad terminologiöversättning begärs:
Inmatning: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Ordbok för verbatim: | Grundläggande kunskaper der regelbundetEs Testen |
Neural ordbok: | Grundläggande kunskaper des regelbundeten Testens |
Förbättring av kvaliteten
Diagrammet nedan illustrerar de betydande förbättringar som den nya funktionen medför för vanliga offentligt tillgängliga terminologitestuppsättningar inom fordonsindustrin (https://aclanthology.org/2021.eacl-main.271), Hälsa (https://aclanthology.org/2021.emnlp-main.477) och Covid-19-domäner (https://aclanthology.org/2021.wmt-1.69) med hjälp av våra allmänna översättningsmodeller.
Vi genomförde också en rad kundutvärderingar av Custom Translator-plattformen och modellerna för neurala ordböcker. Vi mätte den förbättrade översättningskvaliteten på kunddata mellan modeller med och utan tillägget för neurala ordböcker. Fem kunder deltog, med tyska, spanska och franska översättningar inom olika affärsområden.
Diagrammet nedan visar den genomsnittliga förbättringen av KOMET inom utbildningsområdet för engelska-tyska, engelska-spanska och engelska-franska; för generella modeller till vänster och för anpassade modeller till höger. BLÅ färgstaplar representerar allmän översättningskvalitet utan neuralt lexikon och ORANGE färgstaplar representerar översättningskvalitet med neuralt lexikon. Detta är övergripande genomsnittliga förbättringar för hela testuppsättningen. För segment som innehåller en eller flera av kundens ordboksposter (mellan 19 % och 63 %) är förbättringen så hög som +6,3 till +12,9 COMET-poäng.
Språk som stöds
- För närvarande tillgängliga (från och med den 6 december 2023): Förenklad kinesiska, franska, tyska, italienska, japanska, koreanska, polska, ryska, spanska och svenska - till och från engelska.
- Vi kommer att lägga till fler i framtiden. För uppdateringar, se Releaseinformation för Custom Translator.
Hur neurala ordböcker fungerar
Neural ordbok använder inte den exakta find-and-replace-metoden när den hanterar översättning av anpassad terminologi. Istället översätts termer eller fraser från ordboken på ett sätt som passar bäst i hela sammanhanget. Det innebär att termen kan böjas eller ha olika kasus, eller att de omgivande orden kan justeras, vilket ger en mer flytande och sammanhängande översättning.
Låt oss t.ex. säga att vi har följande inmatningsmening på engelska och att den översätts till polska utan några ordboksfraser enligt följande
Inmatning: | Vi behöver en snabb lösning som går att förstå. |
Standardöversättning: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Om du vill vara säker på att "lösning" översätts med "alternatywa" ("an alternative" på engelska), kan du lägga till en dynamisk ordboksanteckning för att uppnå detta:
Inmatning: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Ordbok för verbatim: | Potrzebujemy szybkiego alternatywa, który będzie zrozumiały. |
Neural ordbok: | Potrzebujemy szybkiej Alternativwy, którA będzie zrozumiałA. |
Resultatet från den tidigare metoden är inte flytande eftersom grammatisk genuskonsistens bryts. Den neurala ordboken producerar flytande resultat genom att a) böja den begärda ersättningen och b) ändra de omgivande orden där det behövs. Den kan också ändra kasus i vissa fall, som i följande exempel:
Inmatning: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Ordbok för verbatim: | akcje tej firmy jest tani. |
Neural ordbok: | Akcje tej firmy są tanie. |
Neural dictionary förväntar sig att den begärda översättningen av en term tillhandahålls i sin grundläggande grammatiska form. Termer med flera ord stöds också och bör tillhandahållas som substantivfraser, dvs. orden bör inte lemmatiseras separat (t.ex. "Estonian parliamentary election" är bättre än "Estonia parliament election").
Hur man aktiverar neural ordlista
För alla språk som stöds enligt listan ovan finns en neural ordbok omedelbart tillgänglig för alla kunder som använder Custom Translator-plattformen med frasordböcker. Fullständig (eller endast ordlista) omskolning av anpassad modell krävs för att aktivera neural ordlista.
Rekommendationer
- Om du vill se till att frasen används oftare när du arbetar med neurala ordböcker kan du lägga till frasen med källdelen i olika former. I exemplet ovan, bredvid "lösning _ alternatywa", kanske du vill lägga till följande poster också: "Lösning _ alternatywa", "lösningar _. alternativ", "Lösningar _. alternativ".
- Om målet är att säkerställa att ett visst ord eller en viss fras kopieras "som den är" från inmatningstexten till utmatningsöversättningen när frasordboken används, bör du överväga att använda ordlistan för verbatim eftersom den kan vara mer konsekvent.
- Undvik att lägga till översättningar av vanliga eller frekventa ord eller fraser i fraslexikonet.
Om du vill veta mer om Custom Translator och hur det kan hjälpa ditt företag att utvecklas på den globala marknaden kan du börja med att läsa Nybörjarguide för Custom Translator.
Vad du kan göra med Microsoft Custom Translator
Bygg anpassade modeller med din domänspecifika terminologi och översätt i realtid med hjälp av Microsoft Translator API.
Använda Microsoft anpassad översättare med dina översättningslösningar för att globalisera din verksamhet och förbättra kundkontakterna.
För mer information, besök Microsoft Translator affärslösningar Och Releaseinformation för Custom Translator.