Gå til hovedinnhold
Oversetter
Denne siden er automatisk oversatt av Microsoft Translator sin maskinoversettelsestjeneste. få mer informasjon

Microsoft oversetter blogg

Azure AI Custom Translator Neural Dictionary: Høyere kvalitet på terminologioversettelser 

I dag har vi gleden av å kunngjøre lanseringen av nevrale ordbøker, en betydelig forbedring av oversettelseskvaliteten på plattformen vår. I dette blogginnlegget skal vi se nærmere på funksjonen for nevral ordbok.

Innledning  

Nevrale ordbøker er en utvidelse av vår dynamisk ordbok Og fraseordbok funksjoner i Azure AI Translator. Begge gjør det mulig for brukerne våre å tilpasse oversettelsen ved å legge inn egne oversettelser for spesifikke termer eller fraser. Vår tidligere metode brukte en ordliste med ordrett ordlyd, som var en eksakt finn-og-erstatt-operasjon. Nevrale ordbøker forbedrer oversettelseskvaliteten for setninger som kan inneholde én eller flere termoversettelser ved å la maskinoversettelsesmodellen justere både termen og konteksten for å produsere en mer flytende oversettelse. Samtidig opprettholdes den høye nøyaktigheten i termoversettelsen.  

Følgende engelsk-tyske eksempel viser forskjellene i oversettelsesresultatene mellom de to metodene når du ber om en tilpasset terminologioversettelse: 

Inndata:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Ordrett ordbok:   Grundkenntnisse der regelmäßigEs Testno 
Nevrale ordbøker:   Grundkenntnisse des regelmäßigno Testens 

Kvalitetsforbedring 

Diagrammet nedenfor illustrerer de betydelige forbedringene den nye funksjonen gir i forhold til vanlige, offentlig tilgjengelige terminologitestsett for bilindustrien (https://aclanthology.org/2021.eacl-main.271), helse (https://aclanthology.org/2021.emnlp-main.477) og Covid-19-domener (https://aclanthology.org/2021.wmt-1.69) ved hjelp av våre generelle oversettelsesmodeller. 

Vi gjennomførte også en rekke kundeevalueringer av Custom Translator-plattformen og nevrale ordboksmodeller. Vi målte kvalitetsgevinsten i oversettelseskvaliteten på kundedata mellom modeller med og uten utvidelsen med nevrale ordbøker. Fem kunder deltok i evalueringen, som omfattet tysk, spansk og fransk innenfor ulike forretningsområder.

Diagrammet nedenfor viser den gjennomsnittlige forbedringen av KOMET i utdanningsdomenet for engelsk-tysk, engelsk-spansk og engelsk-fransk; for generelle modeller til venstre og for tilpassede modeller til høyre. BLÅ fargesøyler representerer generell oversettelseskvalitet uten nevral ordbok, og ORANSJE fargesøyler representerer oversettelseskvalitet med nevral ordbok. Dette er gjennomsnittlige forbedringer for hele testsettet. For segmenter som inneholder én eller flere av kundens ordboksoppføringer (mellom 19 % og 63 %), er forbedringen så høy som +6,3 til +12,9 COMET-poeng. 

 Språk som støttes  

  • For øyeblikket tilgjengelig (per 6. desember 2023): Kinesisk forenklet, fransk, tysk, italiensk, japansk, koreansk, polsk, russisk, spansk, svensk og tysk - til og fra engelsk.  
  • Vi legger til flere i fremtiden. For oppdateringer, se Utgivelsesmerknader for Custom Translator 

Slik fungerer nevrale ordbøker 

Nevrale ordbøker bruker ikke den nøyaktige find-and-replace-metoden når de oversetter tilpasset terminologi. I stedet oversetter den termer eller fraser fra ordboken på en måte som passer best mulig til hele konteksten. Det betyr at termen kan bøyes eller ha en annen ordstilling, eller at ordene rundt kan justeres, noe som gir en mer flytende og sammenhengende oversettelse.  

La oss for eksempel si at vi har følgende setning på engelsk, og at den oversettes til polsk uten ordboksfraser på følgende måte:  

Inndata:   Vi trenger en rask og forståelig løsning.  
Standard oversettelse:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Hvis du vil være sikker på at "solution" blir oversatt til "løsning", kan du gjøre følgendealternatywa" ("et alternativ" på engelsk), kan du legge til en dynamisk ordboksannotasjon for å oppnå dette:  

Inndata:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Ordrett ordbok:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Nevrale ordbøker:   Potrzebujemy szybkiej Alternativwy, którA będzie zrozumiałA.  

Resultatet som produseres med den forrige metoden, er ikke flytende, ettersom den grammatiske kjønnskonsistensen brytes. Den nevrale ordboken produserer flytende resultater ved å a) bøye den forespurte erstatningen og b) endre de omkringliggende ordene der det er nødvendig. Den kan også endre kasus i noen tilfeller, som i følgende eksempel:  

Inndata:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Ordrett ordbok:   akcje tej firmy spøk tani.  
Nevrale ordbøker:   Akcje tej firmy tanie.   

Neural ordbok forventer at den forespurte oversettelsen av en term leveres i sin grammatiske grunnform. Termer med flere ord støttes også og bør oppgis som substantivfraser, dvs. at ordene ikke skal lemmatiseres hver for seg (for eksempel vil "estisk parlamentsvalg" være bedre enn "Estlands parlamentsvalg"). 

Slik aktiverer du nevral ordbok 

For alle de støttede språkene som er oppført ovenfor, er neural ordbok umiddelbart tilgjengelig for alle kunder som bruker Custom Translator-plattformen med fraseordbøker. Fullstendig (eller kun ordbok) tilpasset modelloppdatering er nødvendig for å aktivere nevrale ordbøker. 

 Anbefalinger 

  1. Hvis du vil sikre at fraseordbokoppføringen brukes oftere når du arbeider med nevrale ordbøker, kan du vurdere å legge til fraseoppføringen med kildedelen i ulike former. I eksemplet ovenfor er det ved siden av "løsning _ alternatywa", kan det være lurt å legge til følgende oppføringer også: "Løsning _ alternatywa", "solutions _ alternatywy", "Solutions _ alternatywy".  
  2. Hvis målet er å sikre at et spesifikt ord eller en spesifikk frase kopieres "som den er" fra input-teksten til output-oversettelsen ved bruk av fraseordbok, bør du vurdere å bruke en ordrett ordbok, da dette kan være mer konsekvent.   
  3. Unngå å legge til oversettelser av vanlige eller hyppige ord eller fraser i fraseordboken.  

Hvis du vil vite mer om Custom Translator og hvordan det kan hjelpe virksomheten din med å lykkes på det globale markedet, kan du begynne med Nybegynnerveiledning for Custom Translator. 

Hva du kan gjøre med Microsoft Custom Translator 

Bygg egendefinerte modeller med domenespesifikk terminologi og oversett dem i sanntid ved hjelp av Microsoft oversetteren API. 

Bruke Microsoft Custom Translator med oversettelsesløsninger som bidrar til å globalisere virksomheten og forbedre kundeinteraksjonene. 

For mer informasjon, besøk Microsoft Translator forretningsløsninger Og Utgivelsesmerknader for Custom Translator.