Microsoft Custom Translator skyver oversettelseskvalitetslinjen nærmere menneskelig paritet
Custom Translator-reisen for å være i forkant av maskinoversettelsesteknologien fortsetter.
I begynnelsen av august 2020 startet vi vår Custom Translator-oppgradering fra Long Short-Term Memory (aka LSTM) basert neural maskinoversettelsesarkitektur (eller V1) til vår Microsoft Translators toppmoderne Transformer-baserte arkitektur (eller V2). V2 er den samme oversettelsesarkitekturen som driver standard utilpasset Oversetter-API, samt oversettelse i Microsoft Office 365, Tale, Bing.com/translator, Edge og mer.
August-utgivelsen gjorde det mulig for kunder å bruke Ordbok (setning eller setning) dokumenttype for å bygge tilpassede modeller på toppen av V2-plattformen for en rask forbedring av oversettelseskvaliteten over V1-plattformen.
I dag fullførte Custom Translator hele V2-plattformoppgraderingen for å levere en enda større oversettingskvalitetsgevinst enn før. Kunder kan nå bygge egendefinerte modeller med alle dokumenttyper (Opplæring, Testing, Justering, Setningsordliste og Setningsordliste) ved hjelp av fulltekstdokumenter, for eksempel Office-dokumenter, PDF-filer, HTML og ren tekst.
Med denne utgivelsen kan bedrifter, små og mellomstore bedrifter, apputviklere og språktjenesteleverandører bygge avanserte tilpassede nevrale oversettelsessystemer som respekterer deres definerte forretningsterminologi og sømløst integrere disse systemene i eksisterende eller nye programmer, arbeidsflyter og nettsteder for å tiltrekke seg kunder og utvide virksomheten.
Vi setter alle nye baseline språkmodell gjennom en streng menneskelig evalueringsprosess for å sikre at oversettelseskvaliteten fortsetter å oppfylle høye standarder på generiske innspill på tvers av alle domener. Men med spesialtrente spesialiserte oversettelsessystemer kan kundene oppnå mye høyere overholdelse av den domenespesifikke terminologien og stilen ved å trene et tilpasset oversettelsessystem på tidligere oversatte dokumenter i domenet. Disse tidligere oversatte dokumentene gjør det mulig for Custom Translator å lære de foretrukne oversettelsene i sammenheng, slik at Oversetter kan bruke disse vilkårene og uttrykkene når konteksten krever det, og produsere en flytende oversettelse i målspråket, respektere den kontekstavhengige grammatikken til målspråket.
Fordeler med oppgraderingen
Vi bruker BLEU poengsum (en standard måte i forskningsmiljøet) å måle oversettelseskvaliteten til en nyutdannet grunnlinjemodell. En eller to BLEU poenggevinst er en verdig prestasjon. Custom Translator V2-plattformoppgraderingen vil gi betydelige forbedringer sammenlignet med den forrige V1-plattformen. Stolpediagrammet nedenfor viser forbedring av BLEU-poengsum for oversettelseskvalitet for enkelte domener og virkningen av størrelsen på treningsdatasett.
Eksempel domener oversettelse kvalitet BLEU score når du bruker standard Oversetter, Custom Translator V1, og Custom Translator V2.
Opplæring av datasettstørrelse i tusenvis ('auto-28k' betyr 28 000 parallelle setninger for bildomenet)
Det er viktig å merke seg at faktisk kvalitetsforbedring er avhengig av kundedatakvalitet, opplæringsdatasettstørrelse og domenedekning.
"Vi håper at oversettelse gjennom et nevrale nettverk ikke bare vil øke kvalitet og hastighet, men også tilby fremskritt i evalueringen av store data," sier Nikolas Meyer-Aun, leder for kvalitet og leverandørstyring for språk hos Volkswagen AG
Custom Translator vil tilby GRATIS oppgradering til V2. Du kan omskolere én modell per prosjekt i et arbeidsområde til V2-plattformen gratis. Når du viser et prosjekt, skal du se en melding hvis du fortsatt har gratis oppgraderingskreditt for dette prosjektet. Tilbudet starter i dag og avsluttes 31. Etter 31.
Du kan lære mer om oppgraderingen til versjon 2 i FAQ nedenfor.
Spørsmål
- Hva lanserer du i V2?
Vi lanserer en Custom Translator-plattformoppgradering (V2) for å levere betydelige forbedringer av oversettelseskvalitet ved hjelp av Microsofts toppmoderne arkitektur for neural maskinoversettelse. Brukeropplevelsen forblir den samme som i V1. Det er ikke noe nytt å lære, bare bedre oversettelser. Hvis du vil ha en rask oppfriskning, kan du se denne Hurtigstartvideo på YouTube. - Hva er fordelen med å oppgradere en distribuert modell til V2-plattformen?
Betydelig forbedret oversettelseskvalitet; Custom Translator V2 plattform oppgradering vil levere betydelig forbedring over standard Translator og den forrige V1-plattformen. Stolpediagrammet ovenfor viser bleu-poengsummene for oversettelseskvalitet for noen vanlige domener og virkningen av størrelsen på treningsdatasett. - Hvordan bruker jeg min GRATIS oppgradering til V2 kreditt?
Når du viser prosjektdetaljer, blir en gratis kredittmelding synlig (se bilder nedenfor) og vil fortsatt være synlig til du enten omskolerer en modell eller tilbudet avsluttes 31. - Hvordan oppgraderer jeg de distribuerte (eller ikke-distribuerte) egendefinerte modellene mine til V2-plattformen?
Hvis du har en distribuert eller ikke-distribuert ordlistemodell som ble omskolert etter 3. Ellers bør du starte en ny modellopplæring. Når den nye modellen er vellykket trent, vil "Swap" -knappen være synlig. Klikk på "Bytt" for å distribuere den nye modellen. Merk: "Swap"-knappen gjør det mulig å ikke legge ned tid. Det vil si at alle oversettelsesforespørsler vil fortsette å bli servert av den forrige modellen til den nye modellen er distribuert og funksjonell, da vil den nye modellen tjene nye oversettelsesforespørsler, og den forrige modellen vil være uplassert. - Kan jeg fortsette å distribuere V1-egendefinerte modeller på nytt etter oppgraderingen av V2-plattformen?
ja. Vi forstår at det kan være grunner til at kundene ønsker å fortsette å bruke modeller trent på V1-plattformen. V1-modeller kan kjøre på V2-plattformen. I fremtiden vil V1-modeller ikke kunne distribueres på igjen. Merk: Når du omskolerer en V1-modell, vil den nye modellen være på V2-plattformen. Kategorien "Modell" viser alle nye (V2) og tidligere (V1)-modeller. - Jeg er ny på å tilpasse oversettelser, hvordan kommer jeg i gang med Custom Translator?
Hvis du vil bygge en egendefinert modell, kan du se Hurtigstart-videoen ovenfor og se dokumentasjonen docs.microsoft.com: https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
Hva du kan gjøre med Microsoft Custom Translator
Bygg egendefinerte modeller med domenespesifikk terminologi og oversett sanntid ved hjelp av Microsoft Translator API.
Bruk Microsoft Custom Translator med oversettelsesløsningene dine for å globalisere bedriften din og forbedre kundesamhandlinger.
Hvis du vil ha mer informasjon om Microsoft Translator-løsninger, kan du gå til: https://www.microsoft.com/translator/business.