Azure AI Custom Translator Dicționar neural: Oferirea unei calități superioare de traducere a terminologiei
Astăzi, suntem foarte încântați să anunțăm lansarea dicționarului neural, o îmbunătățire semnificativă a calității traducerilor pe platforma noastră. În această postare pe blog, vom explora caracteristica dicționarului neural.
Introducere
Dicționarul neuronal este o extensie a dicționarului nostru dicționar dinamic Şi dicționar de fraze caracteristici în Azure AI Translator. Ambele le permit utilizatorilor noștri să personalizeze traducerile, furnizând propriile lor traduceri pentru termeni sau fraze specifice. Metoda noastră anterioară folosea dicționarul verbatim, care era o operațiune exactă de căutare și înlocuire. Dicționarul neuronal îmbunătățește calitatea traducerii pentru propozițiile care pot include una sau mai multe traduceri de termeni, permițând modelului de traducere automată să ajusteze atât termenul, cât și contextul pentru a produce o traducere mai fluentă. În același timp, acesta păstrează acuratețea ridicată a traducerii termenilor.
Exemplul următor (engleză-germană) demonstrează diferențele dintre cele două metode de traducere atunci când se solicită o traducere terminologică personalizată:
Intrare: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Dicționar Verbatim: | Grundkenntnisse der regelmäßigEs Testro |
Dicționar neuronal: | Grundkenntnisse des regelmäßigro Testens |
Îmbunătățirea calității
Graficul de mai jos ilustrează îmbunătățirile semnificative pe care noua funcție le aduce în cazul seturilor de teste terminologice comune disponibile în mod public în sectorul auto (https://aclanthology.org/2021.eacl-main.271), Sănătate (https://aclanthology.org/2021.emnlp-main.477) și domeniile Covid-19 (https://aclanthology.org/2021.wmt-1.69) utilizând modelele noastre generale de traducere.
De asemenea, am efectuat o serie de evaluări ale clienților cu privire la platforma Custom Translator și la modelele de dicționare neuronale. Am măsurat creșterile de calitate a traducerii pe datele clienților între modelele cu și fără extensia dicționarului neural. Au participat cinci clienți, acoperind limbile germană, spaniolă și franceză în diferite domenii de activitate.
Graficul de mai jos arată îmbunătățirea medie a COMET în domeniul educației pentru limbile engleză-germană, engleză-spaniolă și engleză-franceză; pentru modele generale în stânga și pentru modele personalizate în dreapta. Barele de culoare ALBASTRĂ reprezintă calitatea generală a traducerii fără dicționar neuronal, iar barele de culoare ARANJUIE reprezintă calitatea traducerii cu ajutorul dicționarului neuronal. Acestea sunt îmbunătățiri medii generale pe ansamblul seturilor de teste. Pentru segmentele care includ una sau mai multe intrări din dicționarul clientului (între 19% și 63%), îmbunătățirea este de până la +6,3 până la +12,9 puncte COMET.
Limbi suportate
- Disponibil în prezent (începând cu 6 decembrie 2023): chineză simplificată, franceză, germană, italiană, japoneză, coreeană, poloneză, rusă, spaniolă și suedeză - din și către engleză.
- Vom adăuga și altele în viitor. Pentru actualizări, consultați Note de lansare Custom Translator.
Cum funcționează dicționarul neural
Dicționarul neuronal nu utilizează operațiunea exactă de căutare și înlocuire atunci când gestionează traducerea terminologiei personalizate. În schimb, acesta traduce termenii sau frazele din dicționar într-un mod care se potrivește cel mai bine întregului context. Acest lucru înseamnă că termenul poate fi flexionat sau poate avea o casetă diferită, sau că cuvintele din jur pot fi ajustate, producând o traducere mai fluentă și mai coerentă.
Să presupunem, de exemplu, că avem următoarea propoziție de intrare în limba engleză și traducerea ei în poloneză fără fraze de dicționar este următoarea:
Intrare: | Avem nevoie de o soluție rapidă care să fie ușor de înțeles. |
Traducerea standard: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Dacă doriți să vă asigurați că "soluție" se traduce prin "alternatywa" ("o alternativă" în limba engleză), puteți adăuga o adnotare dinamică de dicționar pentru a realiza acest lucru:
Intrare: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Dicționar Verbatim: | Potrzebujemy szybkiego-ul alternatywa, który będzie zrozumiały. |
Dicționar neuronal: | Potrzebujemy szybkiej alternativwy, którR będzie zrozumiałR. |
Rezultatul produs de metoda anterioară nu este fluent, deoarece se încalcă consistența gramaticală a genurilor. Dicționarul neuronal produce un rezultat fluent prin: a) flexionarea înlocuitorului solicitat și b) modificarea cuvintelor din jur acolo unde este necesar. De asemenea, în unele cazuri, poate schimba și majusculele, ca în exemplul următor:
Intrare: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Dicționar Verbatim: | akcje tej firmy glumă tani. |
Dicționar neuronal: | Akcje tej firmy są tanie. |
Dicționarul neuronal se așteaptă ca traducerea solicitată a unui termen să fie furnizată în forma sa gramaticală de bază. Termenii cu mai multe cuvinte sunt, de asemenea, acceptați și ar trebui să fie furnizați ca fraze substantivale, adică cuvintele nu ar trebui să fie lematizate independent (de exemplu, "Estonian parliamentary election" va fi mai bun decât "Estonia parliament election").
Cum se activează dicționarul neuronal
Pentru toate limbile acceptate enumerate mai sus, dicționarul neuronal este disponibil imediat pentru toți clienții care utilizează platforma Custom Translator cu dicționare de fraze. Pentru a activa dicționarul neuronal este necesară o reeducare completă (sau numai dicționar) a modelului personalizat.
Recomandări
- Dacă doriți să vă asigurați că intrarea în dicționarul de fraze este utilizată mai des atunci când lucrați cu dicționarul neuronal, puteți lua în considerare adăugarea intrării frazei cu partea sursă în diferite forme. În exemplul de mai sus, lângă "soluție _ alternatywa", este posibil să doriți să adăugați și următoarele intrări: "Soluție _ alternatywa", "soluții _ alternatywy", "Soluții _ alternatywy".
- Dacă obiectivul este de a vă asigura că un anumit cuvânt sau o anumită frază este copiat "așa cum este" din textul de intrare în traducerea de ieșire atunci când se utilizează dicționarul de fraze, luați în considerare aplicarea dicționarului textual, deoarece acesta poate fi mai consecvent.
- Evitați să adăugați în dicționarul de fraze traducerile unor cuvinte sau expresii comune sau frecvente.
Pentru a afla mai multe despre Custom Translator și despre modul în care vă poate ajuta afacerea dvs. să prospere pe piața globală, începeți cu pagina Ghidul pentru începători Custom Translator.
Ce puteți face cu Microsoft Custom Translator
Creați modele personalizate cu terminologia specifică domeniului dvs. și traduceți în timp real folosind aplicația API Microsoft Translator.
Utilizaţi Microsoft Custom Translator cu soluțiile dumneavoastră de traducere pentru a vă ajuta să vă globalizați afacerea și să îmbunătățiți interacțiunile cu clienții.
Pentru mai multe informații, vizitați Soluții de afaceri Microsoft Translator Şi Note de lansare Custom Translator.