Azure AI Custom Translator neuroninis žodynas: Aukštesnė terminologijos vertimo kokybė
Šiandien labai džiaugiamės galėdami pranešti apie neuroninio žodyno išleidimą - reikšmingą mūsų platformos vertimo kokybės patobulinimą. Šiame tinklaraščio įraše apžvelgsime neuroninio žodyno funkciją.
Įvadas
Neuroninis žodynas yra mūsų dinaminis žodynas Ir frazių žodynas "Azure AI Translator" funkcijos. Abi jos leidžia mūsų naudotojams pritaikyti vertimo rezultatus pateikiant savo vertimus tam tikriems terminams ar frazėms. Ankstesniame metode naudojome pažodinį žodyną, kuris buvo tiksli radimo ir pakeitimo operacija. Neuroninis žodynas pagerina sakinių, kuriuose gali būti vieno ar daugiau terminų vertimų, vertimo kokybę, leisdamas mašininio vertimo modeliui pritaikyti ir terminą, ir kontekstą, kad vertimas būtų sklandesnis. Kartu jis išsaugo aukštą terminų vertimo tikslumą.
Toliau pateiktame anglų-vokiečių kalbų pavyzdyje parodyta, kaip skiriasi abiejų metodų vertimo rezultatai, kai prašoma versti pasirinktinę terminologiją:
Įvestis: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Verbatim žodynas: | Grundkenntnisse der regelmäßigES Bandymaslt |
Neuroninis žodynas: | Grundkenntnisse des regelmäßiglt Bandymasens |
Kokybės gerinimas
Toliau pateikiamoje diagramoje parodyta, kaip nauja funkcija gerokai pagerina įprastus viešai prieinamus automobilių srities terminologijos testų rinkinius (https://aclanthology.org/2021.eacl-main.271), Sveikata (angl.https://aclanthology.org/2021.emnlp-main.477) ir Covid-19 domenų (https://aclanthology.org/2021.wmt-1.69) naudojant mūsų bendruosius vertimo modelius.
Taip pat atlikome keletą klientų atliktų "Custom Translator" platformos ir neuroninių žodynų modelių vertinimų. Išmatavome klientų duomenų vertimo kokybės padidėjimą tarp modelių su neuroninio žodyno plėtiniu ir be jo. Dalyvavo penki klientai, kurie vertino vokiečių, ispanų ir prancūzų kalbas skirtingose verslo srityse.
Toliau pateiktoje diagramoje parodytas vidutinis pagerėjimas COMET anglų-vokiečių, anglų-ispanų ir anglų-prancūzų kalbų švietimo srityje; kairėje pusėje - bendrieji modeliai, dešinėje - pritaikyti modeliai. Mėlynos spalvos stulpeliais žymima bendroji vertimo kokybė be neuroninio žodyno, o oranžinės spalvos stulpeliais - vertimo kokybė naudojant neuroninį žodyną. Tai bendri vidutiniai visų bandymų rinkinių pagerėjimai. Segmentuose, kuriuose yra vienas ar daugiau kliento žodyno įrašų (nuo 19 % iki 63 %), pagerėjimas siekia nuo +6,3 iki +12,9 COMET taškų.
Palaikomos kalbos
- Šiuo metu yra (nuo 2023 m. gruodžio 6 d.): Į anglų kalbą ir iš jos (iki 2023 m. gruodžio 20 d.): supaprastinta kinų kalba, prancūzų, vokiečių, italų, japonų, korėjiečių, lenkų, rusų, ispanų ir švedų.
- Ateityje pridėsime daugiau. Atnaujinimų rasite Custom Translator išleidimo pastabos.
Kaip veikia neuroninis žodynas
Neuroninis žodynas nenaudoja tikslaus radimo ir pakeitimo veiksmo, kai verčiami pasirinktiniai terminai. Vietoj to jis verčia terminus ar frazes iš žodyno taip, kad jie geriausiai atitiktų visą kontekstą. Tai reiškia, kad terminas gali būti sulietuvintas arba turėti kitokią kirčiuotę, arba gali būti pakoreguoti aplinkiniai žodžiai, taip gaunant sklandesnį ir nuoseklesnį vertimą.
Tarkime, turime tokį įvesties sakinį anglų kalba, o jo vertimas į lenkų kalbą be jokių žodyno frazių yra toks:
Įvestis: | Mums reikia greito ir suprantamo sprendimo. |
Standartinis vertimas: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Jei norite įsitikinti, kad žodis "solution" verčiamas kaip "alternatyva" ("alternatyva" anglų kalba), galite pridėti dinaminio žodyno anotaciją:
Įvestis: | We need a fast <mstrans:dictionary translation=”alternatyva“>solution</mstrans:dictionary> that will be understandable. |
Verbatim žodynas: | Reikalaujame greitąją pagalbąego alternatyva, który bus suprantamasy. |
Neuroninis žodynas: | Reikalaujame greitąją pagalbąej alternatyvaiš, którA bus suprantamasA. |
Ankstesniu metodu gautas rezultatas nėra sklandus, nes pažeidžiamas gramatinės giminės nuoseklumas. Neuroninis žodynas sukuria sklandų rezultatą: a) sugretindamas prašomą pakaitalą ir b) prireikus pakeisdamas aplinkinius žodžius. Kai kuriais atvejais jis taip pat gali pakeisti kirčiavimą, kaip toliau pateiktame pavyzdyje:
Įvestis: | This company’s <mstrans:dictionary translation=”akcijos“>stock</mstrans:dictionary> is cheap. |
Verbatim žodynas: | akcijos ši įmonė juokiasi tani. |
Neuroninis žodynas: | Akcijos ši įmonė są tanie. |
Neuroninis žodynas tikisi, kad prašomas išversti terminas bus pateiktas pagrindine gramatine forma. Palaikomi ir daugiažodžiai terminai, kurie turėtų būti pateikiami kaip daiktavardinės frazės, t. y. žodžiai neturėtų būti lematizuojami atskirai (pavyzdžiui, "Estijos parlamento rinkimai" bus geriau nei "Estijos parlamento rinkimai").
Kaip įjungti neuroninį žodyną
Visų pirmiau išvardytų palaikomų kalbų neuroninis žodynas iš karto prieinamas visiems klientams, naudojantiems "Custom Translator" platformą su frazių žodynai. Norint įjungti neuroninį žodyną, reikia atlikti visišką (arba tik žodyno) pasirinktinį modelio perkvalifikavimą.
Rekomendacijos
- Jei norite užtikrinti, kad frazių žodyno įrašas būtų dažniau naudojamas dirbant su neuroniniu žodynu, galite apsvarstyti galimybę pridėti frazių žodyno įrašą su šaltinio dalimi įvairiomis formomis. Pirmiau pateiktame pavyzdyje šalia "solution _ alternatyva", taip pat galite pridėti šiuos įrašus: "Solution _ alternatyva", "sprendimai _ Alternatyva", "Sprendimai _ Alternatyva".
- Jei siekiama užtikrinti, kad tam tikras žodis ar frazė iš įvesties teksto į išvesties vertimą būtų nukopijuoti "tokie, kokie yra", kai naudojamas frazių žodynas, apsvarstykite galimybę taikyti pažodinį žodyną, nes jis gali būti nuoseklesnis.
- Venkite į frazių žodyną įtraukti dažnai vartojamų žodžių ar frazių vertimus.
Jei norite sužinoti daugiau apie "Custom Translator" ir kaip jis gali padėti jūsų verslui klestėti pasaulinėje rinkoje, pradėkite nuo Pasirinktinio vertėjo pradžiamokslis.
Ką galite daryti su "Microsoft Custom Translator"
Sukurkite pasirinktinius modelius su savo srities terminologija ir verskite realiuoju laiku naudodami Microsoft Translator API.
Naudoti "Microsoft" pasirinktinis vertėjas kartu su vertimo sprendimais, kurie padės globalizuoti jūsų verslą ir pagerinti bendravimą su klientais.
Jei norite gauti daugiau informacijos, apsilankykite "Microsoft Translator" verslo sprendimai Ir Custom Translator išleidimo pastabos.