Ezt az oldalt a Microsoft Translator gépi fordítószolgáltatása automatikusan lefordította. Tudjon meg többet

Mikroszkóp fordító blog

Azure AI Custom Translator Neurális szótár: Magasabb terminológiai fordítási minőség 

Ma nagy örömmel jelentjük be a neurális szótár megjelenését, amely a fordítás minőségének jelentős javulása a platformunkon. Ebben a blogbejegyzésben a neurális szótár funkciót fogjuk megvizsgálni.

Bevezetés  

A neurális szótár a mi dinamikus szótár És kifejezés szótár az Azure AI Translator funkciói. Mindkettő lehetővé teszi felhasználóink számára, hogy testre szabják a fordítási kimenetet azáltal, hogy saját fordításokat adnak meg bizonyos kifejezésekhez vagy kifejezésekhez. Korábbi módszerünk a szó szerinti szótárat használta, ami egy pontos keresés és helyettesítés művelet volt. A neurális szótár javítja a fordítás minőségét olyan mondatok esetében, amelyek egy vagy több kifejezés fordítását tartalmazhatják, mivel a gépi fordítási modell mind a kifejezést, mind a kontextust kiigazítja a gördülékenyebb fordítás érdekében. Ugyanakkor megőrzi a magas terminusfordítási pontosságot.  

Az alábbi angol-német példa a két módszer közötti fordítási kimeneti különbségeket mutatja, amikor egyéni terminológiai fordítást kérnek: 

Bemenet:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Szó szerinti szótár:   Grundkenntnisse der rendszeresenes Teszten 
Neurális szótár:   Grundkenntnisse des rendszeresenen Tesztens 

Minőségfejlesztés 

Az alábbi táblázat szemlélteti, hogy az új funkció milyen jelentős javulást eredményez az autóipari terminológiai tesztkészleteken (https://aclanthology.org/2021.eacl-main.271), egészségügy (https://aclanthology.org/2021.emnlp-main.477) és a Covid-19 tartományok (https://aclanthology.org/2021.wmt-1.69) általános fordítási modelljeink segítségével. 

Egy sor ügyfélértékelést is végeztünk a Custom Translator platformmal és a neurális szótármodellekkel kapcsolatban. Az ügyféladatokon mértük a fordítási minőség javulását a neurális szótárbővítéssel ellátott és a neurális szótárbővítés nélküli modellek között. Öt ügyfél vett részt, akik német, spanyol és francia nyelvterületeket fedtek le különböző üzleti területeken.

Az alábbi diagram az átlagos javulást mutatja COMET az oktatás területén az angol-német, az angol-spanyol és az angol-francia nyelvek esetében; az általános modellek a bal oldalon, a testreszabott modellek pedig a jobb oldalon. A KÉK színű sávok az általános fordítási minőséget jelölik neurális szótár nélkül, a NARANCS színű sávok pedig a fordítási minőséget neurális szótár használatával. Ezek a teljes tesztkészletekre vonatkozó általános átlagos javulások. Az egy vagy több ügyfél szótári bejegyzését tartalmazó szegmensek esetében (19% és 63% között) a javulás elérte a +6,3 és +12,9 COMET-pont közötti értéket. 

 Támogatott nyelvek  

  • Jelenleg elérhető (2023. december 6-tól): Angolból és angolból egyszerűsített kínai, francia, német, olasz, japán, koreai, lengyel, orosz, spanyol és svéd nyelvre.  
  • A jövőben továbbiakkal bővülünk. A frissítésekért lásd Egyéni fordító kiadási megjegyzések 

Hogyan működik a neurális szótár 

A neurális szótár nem alkalmazza a pontos keresés-helyettesítés műveletet az egyéni terminológiai fordítás kezelésénél. Ehelyett a szótárból származó kifejezéseket vagy kifejezéseket úgy fordítja le, hogy az a legjobban illeszkedjen a teljes kontextushoz. Ez azt jelenti, hogy a kifejezés lehet flektált vagy eltérő szófajú, illetve a környező szavakhoz is igazodhat, ami gördülékenyebb és koherensebb fordítást eredményez.  

Tegyük fel, hogy például a következő bemeneti mondatunk van angolul, és a fordítása lengyelre szótári kifejezések nélkül a következő:  

Bemenet:   Gyors és érthető megoldásra van szükségünk.  
Szabványos fordítás:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Ha azt szeretné, hogy a "solution" fordítása "alternatywa" ("an alternative" angolul: "egy alternatíva"), akkor egy dinamikus szótári megjegyzést adhat hozzá, hogy ezt elérje:  

Bemenet:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Szó szerinti szótár:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Neurális szótár:   Potrzebujemy szybkiej alternatywy, którA będzie zrozumiałA.  

Az előző módszer által előállított kimenet nem folyékony, mivel a nyelvtani nemek közötti konzisztencia sérül. A neurális szótár folyékony kimenetet állít elő a) a kért helyettesítés flektálásával és b) a környező szavak szükség szerinti megváltoztatásával. Bizonyos esetekben a szókezdetet is képes megváltoztatni, mint a következő példában:  

Bemenet:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Szó szerinti szótár:   akcje tej firmy vicc tani.  
Neurális szótár:   Akcje tej firmy tanie.   

A neurális szótár elvárja, hogy a kifejezés kért fordítását a nyelvtani alapformában adja meg. A többszavas kifejezések is támogatottak, és azokat főnévi kifejezésként kell megadni, azaz a szavakat nem szabad önállóan lemmatizálni (például az "észt parlamenti választások" jobb lesz, mint az "észt parlamenti választások"). 

Neurális szótár engedélyezése 

A fent felsorolt összes támogatott nyelv esetében a neurális szótár azonnal elérhető minden ügyfél számára, aki a Custom Translator platformot használja a következő szolgáltatással kifejezés szótárak. A neurális szótár engedélyezéséhez teljes (vagy csak szótár) egyéni modell-átképzésre van szükség. 

 Ajánlások 

  1. Ha azt szeretné elérni, hogy a frázisszótári bejegyzést gyakrabban használják a neurális szótárral való munka során, akkor megfontolhatja, hogy a frázisszótári bejegyzést a forrásrészlettel együtt különböző formában adja meg. A fenti példában a "megoldás _" mellett alternatywa", érdemes a következő bejegyzéseket is hozzáadni: "Megoldás _ alternatywa", "megoldások _ alternatywy", "Megoldások _ alternatywy".  
  2. Ha a cél annak biztosítása, hogy egy adott szót vagy kifejezést "változatlanul" másoljon a bemeneti szövegből a kimeneti fordításba a kifejezésszótár használatakor, fontolja meg a szó szerinti szótár érvényesítését, mivel az következetesebb lehet.   
  3. Kerülje a gyakori vagy gyakori szavak vagy kifejezések fordításainak hozzáadását a kifejezésszótárhoz.  

Ha többet szeretne megtudni a Custom Translatorról, és arról, hogyan segítheti vállalkozását a globális piacon való boldogulásban, kezdje a Custom Translator kezdő útmutató. 

A Microsoft Egyéni Fordító val? 

Építsen egyéni modelleket a saját szakterminológiájával, és fordítsa le valós időben a Microsoft fordító API. 

Használja Microsoft egyéni fordító a fordítási megoldásokkal, hogy segítsen globalizálni vállalkozását és javítsa az ügyfélkapcsolatokat. 

További információért látogasson el a Microsoft Translator üzleti megoldások És Egyéni fordító kiadási megjegyzések.