Microsoft Translator ' i masintõlke teenus on selle lehe automaatselt tõlkinud. Lisateave

Microsofti tõlkija blogi

Azure AI Custom Translator Neural Dictionary: Kõrgem terminoloogia tõlkekvaliteet 

Täna on meil väga hea meel teatada, et meie platvormi jaoks on välja antud neuronaalne sõnastik, mis on märkimisväärne tõlkekvaliteedi parandamine. Selles blogipostituses tutvume neuraalsõnastiku funktsiooniga.

Sissejuhatus  

Neuraalne sõnastik on meie laiendus dünaamiline sõnastik Ja fraasi sõnastik Azure AI Translator funktsioonid. Mõlemad võimaldavad meie kasutajatel kohandada tõlke väljundit, pakkudes oma tõlkeid konkreetsete terminite või fraaside jaoks. Meie eelmine meetod kasutas sõna-sõnaraamatut, mis oli täpne leidmise ja asendamise toiming. Neuraalne sõnastik parandab tõlkekvaliteeti lausete puhul, mis võivad sisaldada ühe või mitme termini tõlkeid, lastes masintõlkemudelil kohandada nii terminit kui ka konteksti, et toota sujuvamat tõlget. Samal ajal säilitab see kõrge terminite tõlketäpsuse.  

Järgmine inglise-saksa näide näitab mõlema meetodi tõlkimistulemuste erinevusi, kui taotletakse kohandatud terminoloogia tõlget: 

Sisend:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Sõnasõnastik:   Grundkenntnisse der regulaarseltEs Testet 
Neuraalne sõnastik:   Grundkenntnisse des regulaarseltet Testens 

Kvaliteedi parandamine 

Alljärgnevas tabelis on näidatud uue funktsiooni märkimisväärne paranemine autotööstuses levinud avalikult kättesaadavate terminoloogia testikogumite puhul (https://aclanthology.org/2021.eacl-main.271), tervis (https://aclanthology.org/2021.emnlp-main.477) ja Covid-19 domeenid (https://aclanthology.org/2021.wmt-1.69), kasutades meie üldisi tõlkemudeleid. 

Samuti viisime läbi hulga klientide hinnanguid Custom Translator platvormi ja neuraalsete sõnastikumudelite kohta. Mõõtsime kliendi andmete põhjal tõlkekvaliteedi paranemist neuraalsõnastiku laiendusega ja ilma selleta mudelite vahel. Osales viis klienti, kes hõlmasid saksa, hispaania ja prantsuse keelt erinevates ärivaldkondades.

Alljärgnevas graafikus on esitatud keskmine paranemine COMET haridusvaldkonnas inglise-saksa, inglise-hispaania ja inglise-prantsuse keele puhul; vasakul üldised mudelid ja paremal kohandatud mudelid. SINISED värvilised tulbad tähistavad üldist tõlkekvaliteeti ilma neuraalsõnaraamatuta ja ORANŽid värvilised tulbad tähistavad tõlkekvaliteeti neuraalsõnaraamatut kasutades. Need on üldised keskmised parandused kogu testkogumi puhul. Ühe või mitme kliendi sõnaraamatu kirjet sisaldavate segmentide puhul (vahemikus 19% kuni 63%) on paranemine koguni +6,3 kuni +12,9 COMET-punkti. 

 Toetatud keeled  

  • Praegu saadaval (seisuga 6. detsember 2023): Hiina lihtsustatud, prantsuse, saksa, itaalia, jaapani, korea, poola, vene, hispaania ja rootsi keelest ja inglise keelde.  
  • Tulevikus lisame veel rohkem. Uuendusi leiate aadressil Kohandatud tõlkijate versioon märkusi 

Kuidas neuraalne sõnastik töötab 

Neuraalne sõnastik ei kasuta kohandatud terminoloogiatõlke käsitlemisel täpset leidmise ja asendamise operatsiooni. Selle asemel tõlgib ta terminid või fraasid sõnaraamatust nii, et need sobivad kõige paremini kogu konteksti. See tähendab, et termin võib olla flekteeritud või erinevas käändes või et ümbritsevaid sõnu saab kohandada, mis annab sujuvama ja sidusama tõlke.  

Ütleme näiteks, et meil on järgmine ingliskeelne sisendlause ja selle tõlge poola keelde ilma sõnastikfraasideta on järgmine:  

Sisend:   Me vajame kiiret ja arusaadavat lahendust.  
Standardtõlge:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Kui soovite veenduda, et "lahendus" on tõlgitud kui "alternatywa" ("alternatiiv" inglise keeles), saate selle saavutamiseks lisada dünaamilise sõnastiku märkuse:  

Sisend:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Sõnasõnastik:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Neuraalne sõnastik:   Potrzebujemy szybkiej alternatywy, którA będzie zrozumiałA.  

Eelmise meetodi abil saadud väljund ei ole sujuv, kuna grammatiline sooline järjepidevus on rikutud. Neuronaalne sõnastik toodab voolava väljundi, a) muutes nõutava asenduse ja b) muutes vajaduse korral ümbritsevaid sõnu. Mõnel juhul võib see muuta ka korpust, nagu järgmises näites:  

Sisend:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Sõnasõnastik:   akcje tej firmy jest tani.  
Neuraalne sõnastik:   Akcje tej firmy tanie.   

Neuraalne sõnaraamat eeldab, et terminite soovitud tõlge esitatakse selle grammatilisel põhivormil. Toetatakse ka mitmesõnalisi termineid, mis tuleks esitada nimisõnafraasidena, st sõnu ei tohiks lemmatiseerida iseseisvalt (näiteks "Eesti parlamendivalimised" on parem kui "Eesti parlamendivalimised"). 

Kuidas lubada neuraalset sõnaraamatut 

Kõigi eespool loetletud toetatud keelte puhul on neuraalne sõnastik kohe kättesaadav kõigile klientidele, kes kasutavad Custom Translator platvormi koos fraasi sõnastikud. Täielik (või ainult sõnastik) kohandatud mudeli ümberõpe on vajalik, et võimaldada neuronaalset sõnastikku. 

 Soovitused 

  1. Kui soovite tagada, et fraasisõnastiku kirjet kasutatakse neuraalsõnastikuga töötades sagedamini, võite kaaluda fraasikande lisamist koos lähteosaga erinevates vormides. Ülaltoodud näites on "solution _" kõrval alternatywa", võite lisada ka järgmised kanded: "Lahendus _ alternatywa", "lahendused _ alternatywy", "Lahendused _ alternatywy".  
  2. Kui eesmärk on tagada, et konkreetne sõna või fraas kopeeritakse fraasisõnastiku kasutamisel sisendtekstist väljundtõlkesse "nagu on", kaaluge sõnasõnastiku jõustamist, kuna see võib olla järjepidevam.   
  3. Vältige üldlevinud või sagedaste sõnade või väljendite tõlkeid fraasisõnaraamatusse lisamist.  

Kui soovite rohkem teada saada Custom Translatorist ja sellest, kuidas see võib aidata teie ettevõttel globaalsel turul edukalt tegutseda, alustage veebilehelt Custom Translator algajate juhend. 

Mida saate teha Microsoft Custom Translatoriga? 

Ehitage kohandatud mudeleid oma valdkonna spetsiifilise terminoloogiaga ja tõlkige need reaalajas, kasutades Microsoft Translator API. 

Kasutada Microsoft Custom Translator koos teie tõlkelahendustega, et aidata globaliseerida oma äri ja parandada kliendisuhtlust. 

Lisateabe saamiseks külastage Microsoft Translator ärilahendused Ja Kohandatud tõlkijate versioon märkusi.