Azure AI Custom Translator neironu vārdnīca: Augstāka terminoloģijas tulkojumu kvalitāte
Šodien mēs esam ļoti priecīgi paziņot par neironu vārdnīcas iznākšanu, kas ir būtisks mūsu platformas tulkošanas kvalitātes uzlabojums. Šajā bloga ierakstā mēs aplūkosim neironu vārdnīcas funkciju.
Ievads
Neironu vārdnīca ir mūsu dinamiskā vārdnīca Un frāžu vārdnīca Azure AI tulkotāja funkcijas. Abas šīs iespējas ļauj lietotājiem pielāgot tulkojuma rezultātu, sniedzot savus tulkojumus konkrētiem terminiem vai frāzēm. Mūsu iepriekšējā metode izmantoja verbatim vārdnīcu, kas bija precīza atrašanas un aizstāšanas operācija. Neironu vārdnīca uzlabo tulkojuma kvalitāti teikumiem, kas var ietvert viena vai vairāku terminu tulkojumus, ļaujot mašīntulkošanas modelim pielāgot gan terminu, gan kontekstu, lai nodrošinātu vienmērīgāku tulkojumu. Tajā pašā laikā tas saglabā augstu terminu tulkojuma precizitāti.
Nākamajā angļu-vācu valodas piemērā ir parādītas tulkojumu rezultātu atšķirības starp abām metodēm, ja tiek pieprasīts pielāgotas terminoloģijas tulkojums:
Ieejas dati: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Verbatim vārdnīca: | Grundkenntnisse der regelmäßiges Testalv |
Neironu vārdnīca: | Grundkenntnisse des regelmäßiglv Testaens |
Kvalitātes uzlabošana
Zemāk redzamajā diagrammā ir ilustrēti būtiskie uzlabojumi, ko jaunā funkcija sniedz kopējos publiski pieejamos automobiļu nozares terminoloģijas testu kopumos (https://aclanthology.org/2021.eacl-main.271), veselība (https://aclanthology.org/2021.emnlp-main.477) un Covid-19 domēni (https://aclanthology.org/2021.wmt-1.69), izmantojot mūsu vispārējos tulkošanas modeļus.
Mēs arī veicām virkni klientu novērtējumu par Custom Translator platformu un neironu vārdnīcu modeļiem. Mēs mērījām tulkošanas kvalitātes pieaugumu klientu datos starp modeļiem ar un bez neironu vārdnīcas paplašinājuma. Piedalījās pieci klienti, aptverot vācu, spāņu un franču valodu dažādās uzņēmējdarbības jomās.
Zemāk redzamajā diagrammā parādīts vidējais uzlabojums COMET izglītības jomā angļu-vācu, angļu- spāņu un angļu-franču valodām; vispārējiem modeļiem - pa kreisi, bet pielāgotiem modeļiem - pa labi. ZILAS krāsas joslas attēlo vispārīgo tulkošanas kvalitāti bez neironu vārdnīcas, bet ORANŽAS krāsas joslas attēlo tulkošanas kvalitāti, izmantojot neironu vārdnīcu. Tie ir kopējie vidējie uzlabojumi visās testa kopās. Segmentos, kas ietver vienu vai vairākus klienta vārdnīcas ierakstus (no 19 % līdz 63 %), uzlabojums sasniedz +6,3 līdz +12,9 COMET punktus.
Atbalstītās valodas
- Pašlaik pieejams (2023. gada 6. decembrī): franču, itāliešu, japāņu, korejiešu, ķīniešu vienkāršotā, poļu, krievu, krievu, spāņu, vācu, zviedru, vācu un zviedru valoda - uz angļu valodu un no tās.
- Nākotnē mēs pievienosim vēl citas. Lai iegūtu atjauninājumus, skatiet Pielāgotā tulkotāja izlaiduma piezīmes.
Kā darbojas neironu vārdnīca
Neironu vārdnīca neizmanto precīzu atrašanas un aizstāšanas operāciju, apstrādājot pielāgotu terminoloģijas tulkojumu. Tā vietā tā tulko terminus vai frāzes no vārdnīcas tādā veidā, kas vislabāk atbilst visam kontekstam. Tas nozīmē, ka termins var tikt locīts vai tam var būt cits locījums, vai arī var pielāgot apkārtējos vārdus, tādējādi iegūstot vienmērīgāku un saskaņotāku tulkojumu.
Teiksim, piemēram, mums ir šāds ievadteikums angļu valodā, un tā tulkojums poļu valodā bez vārdnīcas frāzēm ir šāds:
Ieejas dati: | Mums ir nepieciešams ātrs un saprotams risinājums. |
Standarta tulkojums: | Potrzebujemy szybkiego risinājumu, kas būs saprotams. |
Ja vēlaties pārliecināties, ka "risinājums" tiek tulkots kā "alternatīva" ("alternatīva" angļu valodā), lai to panāktu, varat pievienot dinamiskās vārdnīcas anotāciju:
Ieejas dati: | We need a fast <mstrans:dictionary translation=”alternatīva“>solution</mstrans:dictionary> that will be understandable. |
Verbatim vārdnīca: | Potrzebujemy ātrās palīdzībasego alternatīva, który будет zrozumiały. |
Neironu vārdnīca: | Potrzebujemy ātrās palīdzībasej alternatīvauz, którA будет zrozumiałA. |
Iepriekšējās metodes rezultātā iegūtā produkcija nav tekoša, jo tiek pārkāpta gramatiskā dzimtes konsekvence. Neironu vārdnīca rada plūstošu rezultātu, a) atveidojot pieprasīto aizvietotāju un b) vajadzības gadījumā mainot apkārtējos vārdus. Atsevišķos gadījumos tā var arī mainīt locījumu, kā nākamajā piemērā:
Ieejas dati: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Verbatim vārdnīca: | akcje šīs firmas joks tani. |
Neironu vārdnīca: | Akcijas šīs firmas są tanie. |
Neironu vārdnīca sagaida, ka pieprasītais termina tulkojums tiks sniegts tā pamata gramatiskajā formā. Tiek atbalstīti arī vairāku vārdu termini, un tie ir jāsniedz kā lietvārdu frāzes, t. i., vārdi nav jālemmatizē atsevišķi (piemēram, "Igaunijas parlamenta vēlēšanas" būs labāk nekā "Igaunijas parlamenta vēlēšanas").
Kā iespējot neironu vārdnīcu
Visām iepriekš minētajām atbalstāmajām valodām neironu vārdnīca ir nekavējoties pieejama visiem klientiem, kuri izmanto Custom Translator platformu ar frāžu vārdnīcas. Lai iespējotu neironu vārdnīcu, ir nepieciešama pilnīga (vai tikai vārdnīcas) pielāgota modeļa pārkvalificēšana.
Ieteikumi
- Ja vēlaties, lai frāžu vārdnīcas ieraksts tiktu izmantots biežāk, strādājot ar neironisko vārdnīcu, varat apsvērt iespēju pievienot frāžu vārdnīcas ierakstu ar avota daļu dažādās formās. Iepriekš minētajā piemērā blakus vārdkopai "risinājums _ alternatīva", varat pievienot arī šādus ierakstus: "Risinājums _ alternatīva", "risinājumi _ alternatīvs", "Risinājumi _ alternatīvs".
- Ja mērķis ir nodrošināt, ka, izmantojot frāžu vārdnīcu, konkrēts vārds vai frāze no ievades teksta tiek nokopēta "tāda, kāda tā ir" uz izejas tulkojumu, apsveriet iespēju izmantot burtisko vārdnīcu, jo tā var būt konsekventāka.
- Izvairieties pievienot frāžu vārdnīcai biežāk lietoto vai bieži lietoto vārdu vai frāžu tulkojumus.
Lai uzzinātu vairāk par Custom Translator un to, kā tas var palīdzēt jūsu uzņēmumam attīstīties globālajā tirgū, sāciet ar Pielāgota tulkotāja rokasgrāmata iesācējiem.
Ko var darīt ar Microsoft pielāgoto translatoru
Izveidojiet pielāgotus modeļus ar savai jomai specifisku terminoloģiju un tulkojiet tos reāllaikā, izmantojot Microsoft Translator API.
Izmantot Microsoft pielāgotais tulkotājs ar tulkošanas risinājumiem, lai palīdzētu globalizēt jūsu uzņēmumu un uzlabotu klientu mijiedarbību.
Lai iegūtu vairāk informācijas, apmeklējiet Microsoft Translator biznesa risinājumi Un Pielāgotā tulkotāja izlaiduma piezīmes.