Siirry päähistoria
Kääntäjä
Microsoft Translatorin kone käännös palvelu on kääntänyt tämän sivun automaattisesti. Opi lisää

Microsoft Kääntäjä blogi

Azure AI Custom Translator Neuraalinen sanakirja: Terminologiakäännösten laadun parantaminen 

Tänään, olemme erittäin innoissamme voidessamme ilmoittaa julkaisusta neuraalisen sanakirjan, merkittävä käännös laadun parantaminen meidän alustan. Tässä blogikirjoituksessa tutustumme neuraalisen sanakirjan ominaisuuteen.

Johdanto  

Neuraalinen sanakirja on laajennus meidän dynaaminen sanakirja Ja fraasisanakirja Azure AI Translator -palvelun ominaisuudet. Molemmat antavat käyttäjillemme mahdollisuuden mukauttaa käännöstulosta antamalla omia käännöksiä tietyille termeille tai lausekkeille. Aiempi menetelmämme käytti sanatarkkaa sanakirjaa, joka oli tarkka Etsi ja korvaa -toiminto. Neuraalinen sanakirja parantaa käännöksen laatua lauseissa, jotka voivat sisältää yhden tai useamman termin käännökset, antamalla konekäännösmallin mukauttaa sekä termiä että kontekstia sujuvamman käännöksen tuottamiseksi. Samalla se säilyttää korkean termikäännöstarkkuuden.  

Seuraavassa englannin ja saksan välisessä esimerkissä osoitetaan, että käännöstulokset eroavat molempien menetelmien välillä, kun pyydetään mukautetun terminologian käännöstä: 

Syöttö:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Sanatarkka sanakirja:   Grundkenntnisse der säännöllisestiEs Testifi 
Neuraalinen sanakirja:   Grundkenntnisse des säännöllisestifi Testiens 

Laadun parantaminen 

Alla oleva kaavio havainnollistaa uuden ominaisuuden tuomat merkittävät parannukset tavallisissa julkisesti saatavilla olevissa autoteollisuuden terminologian testikokonaisuuksissa (https://aclanthology.org/2021.eacl-main.271), terveys (https://aclanthology.org/2021.emnlp-main.477) ja Covid-19-alueet (https://aclanthology.org/2021.wmt-1.69) käyttämällä yleisiä käännösmallejamme. 

Teimme myös useita asiakasarviointeja Custom Translator -alustasta ja neuraalisista sanakirjamalleista. Mittasimme käännöksen laadun paranemista asiakastiedoissa mallien välillä, joissa oli neuraalinen sanakirjalaajennus, ja mallien välillä, joissa ei ollut neuraalista sanakirjalaajennusta. Tutkimukseen osallistui viisi asiakasta, jotka edustivat saksaa, espanjaa ja ranskaa eri liiketoiminta-aloilla.

Alla olevasta kaaviosta käy ilmi keskimääräinen parannus COMET koulutusalalla englannin-saksan, englannin-espanjan ja englannin-ranskan osalta; vasemmalla yleiset mallit ja oikealla räätälöidyt mallit. SINISET väripalkit kuvaavat yleistä käännöslaatua ilman neuraalista sanakirjaa ja ORANSSIT väripalkit kuvaavat käännöslaatua neuraalisen sanakirjan avulla. Nämä ovat yleisiä keskimääräisiä parannuksia koko testijoukossa. Niiden segmenttien osalta, jotka sisältävät yhden tai useamman asiakkaan sanakirjamerkinnän (19-63 %), parannus on jopa +6,3-12,9 COMET-pistettä. 

 Tuetut kielet  

  • Tällä hetkellä saatavilla (6. joulukuuta 2023 alkaen): Englannista ja englannista käsin: yksinkertaistettu kiinalainen, espanjalainen, italialainen, japanilainen, korealainen, puolalainen, ranskalainen, saksalainen, ruotsalainen, venäläinen ja ranskalainen.  
  • Lisäämme niitä tulevaisuudessa. Päivitykset löydät osoitteesta Mukautetun kääntäjän julkaisutiedot 

Miten neuraalinen sanakirja toimii 

Neuraalinen sanakirja ei käytä tarkkaa Etsi ja korvaa -operaatiota käsitellessään mukautettua terminologian käännöstä. Sen sijaan se kääntää termit tai lauseet sanakirjasta tavalla, joka sopii parhaiten koko asiayhteyteen. Tämä tarkoittaa sitä, että termi voi olla taivutettu tai että sen taivutus voi olla erilainen tai että ympäröiviä sanoja voidaan mukauttaa, mikä tuottaa sujuvamman ja johdonmukaisemman käännöksen.  

Sanotaan esimerkiksi, että meillä on seuraava englanninkielinen lause ja sen käännös puolaksi ilman sanakirjan lauseita on seuraava:  

Syöttö:   Tarvitsemme nopean ja ymmärrettävän ratkaisun.  
Vakiokäännös:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Jos haluat varmistaa, että "solution" käännetään muotoon "alternatywa" ("an alternative" englanniksi), voit lisätä dynaamisen sanakirjamerkinnän:  

Syöttö:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Sanatarkka sanakirja:   Potrzebujemy szybkiego alternatywa, który będzie zrozumiały.  
Neuraalinen sanakirja:   Potrzebujemy szybkiej vaihtoehtoinenwy, którA będzie zrozumiałA.  

Edellisellä menetelmällä tuotettu tuotos ei ole sujuva, koska kieliopillista sukupuolen johdonmukaisuutta rikotaan. Neuraalinen sanakirja tuottaa sujuvan tuloksen a) taivuttamalla halutun korvauksen ja b) muuttamalla ympäröiviä sanoja tarvittaessa. Joissakin tapauksissa se voi myös muuttaa taivutusasua, kuten seuraavassa esimerkissä:  

Syöttö:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Sanatarkka sanakirja:   akcje tej firmy jest tani.  
Neuraalinen sanakirja:   Akcje tej firmy tanie.   

Neuraalinen sanakirja odottaa, että termistä pyydetty käännös annetaan sen kieliopillisessa perusmuodossa. Myös monisanaisia termejä tuetaan, ja ne on annettava substantiivilausekkeina, eli sanoja ei saa lemmatisoida itsenäisesti (esimerkiksi "Viron parlamenttivaalit" on parempi kuin "Viron parlamenttivaalit"). 

Miten neuraalinen sanakirja otetaan käyttöön 

Kaikkien edellä lueteltujen tuettujen kielten osalta neuraalinen sanakirja on välittömästi kaikkien Custom Translator -alustaa käyttävien asiakkaiden käytettävissä. fraasisanakirjat. Täydellinen (tai vain sanakirja) mukautettu mallin uudelleenkoulutus vaaditaan, jotta neuraalinen sanakirja voidaan ottaa käyttöön. 

 Suositukset 

  1. Jos haluat varmistaa, että fraasisanakirjamerkintää käytetään useammin työskenneltäessäsi neuraalisen sanakirjan kanssa, voit harkita fraasisanakirjamerkinnän lisäämistä lähdeosalla eri muodoissa. Yllä olevassa esimerkissä "solution _" vieressä on alternatywa", voit lisätä myös seuraavat merkinnät: "Ratkaisu _ alternatywa", "ratkaisut _ vaihtoehtoinen", "Ratkaisut _ vaihtoehtoinen".  
  2. Jos tavoitteena on varmistaa, että tietty sana tai lause kopioidaan "sellaisenaan" tulotekstistä tulosteksteihin, kun käytetään fraasisanakirjaa, harkitse sanatarkan sanakirjan käyttöä, koska se voi olla johdonmukaisempi.   
  3. Vältä lisäämästä yleisten tai usein esiintyvien sanojen tai lausekkeiden käännöksiä fraasisanakirjaan.  

Jos haluat lisätietoja Custom Translatorista ja siitä, miten se voi auttaa yritystäsi menestymään globaaleilla markkinoilla, aloita osoitteesta Mukautetun kääntäjän aloittelijan opas. 

Mitä voit tehdä Microsoft Custom Kääntäjä 

Rakenna mukautettuja malleja toimialakohtaisella terminologiallasi ja käännä reaaliaikaisesti käyttämällä Microsoft Kääntäjä API. 

Käyttää Microsoftin mukautettu kääntäjä käännösratkaisujen kanssa, jotta voit globalisoida liiketoimintasi ja parantaa asiakkaiden vuorovaikutusta. 

Lisätietoja on osoitteessa Microsoft Translator liiketoimintaratkaisut Ja Mukautetun kääntäjän julkaisutiedot.