Dizionario neurale del traduttore personalizzato per intelligenza artificiale di Azure: Offrire una qualità di traduzione terminologica superiore
Oggi siamo entusiasti di annunciare il rilascio di neural dictionary, un significativo miglioramento della qualità della traduzione per la nostra piattaforma. In questo post del blog, esploreremo la funzione del dizionario neurale.
Introduzione
Il dizionario neurale è un'estensione del nostro Dizionario dinamico e Dizionario delle frasi funzionalità in Azure AI Translator. Entrambi consentono ai nostri utenti di personalizzare l'output della traduzione fornendo le proprie traduzioni per termini o frasi specifiche. Il nostro metodo precedente utilizzava il dizionario verbatim, che era un'operazione di ricerca e sostituzione esatta. Il dizionario neurale migliora la qualità della traduzione per le frasi che possono includere una o più traduzioni di termini, consentendo al modello di traduzione automatica di regolare sia il termine che il contesto per produrre una traduzione più fluida. Allo stesso tempo, preserva l'elevata precisione della traduzione a termine.
L'esempio inglese-tedesco seguente illustra le differenze negli output di traduzione tra i due metodi quando viene richiesta una traduzione terminologica personalizzata:
Immissione: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Dizionario integrale: | Grundkenntnisse Der regelmäßiges TestEn |
Dizionario neurale: | Grundkenntnisse DES regelmäßigEn TestEns |
Miglioramento della qualità
Il grafico seguente illustra i miglioramenti significativi apportati dalla nuova funzionalità ai set di test terminologici comuni disponibili al pubblico nel settore automobilistico (https://aclanthology.org/2021.eacl-main.271), la salute (https://aclanthology.org/2021.emnlp-main.477) e i domini Covid-19 (https://aclanthology.org/2021.wmt-1.69) utilizzando i nostri modelli di traduzione generali.
Abbiamo anche condotto una serie di valutazioni dei clienti sulla piattaforma Custom Translator e sui modelli di dizionario neurale. Abbiamo misurato i miglioramenti della qualità della traduzione sui dati dei clienti tra i modelli con e senza l'estensione del dizionario neurale. Hanno partecipato cinque clienti, che coprivano tedesco, spagnolo e francese in diversi settori di attività.
Il grafico sottostante mostra il miglioramento medio di COMETA nel settore dell'istruzione per inglese-tedesco, inglese-spagnolo e inglese-francese; per i modelli generici a sinistra e per i modelli personalizzati a destra. Le barre di colore BLU rappresentano la qualità generale della traduzione senza dizionario neurale e le barre di colore ARANCIONE rappresentano la qualità della traduzione utilizzando il dizionario neurale. Si tratta di miglioramenti medi complessivi sull'intero set di test. Per i segmenti che includono una o più voci del dizionario dei clienti (tra il 19% e il 63%), il miglioramento è compreso tra +6,3 e +12,9 punti COMET.
Lingue supportate
- Attualmente disponibili (a partire dal 6 dicembre 2023): cinese semplificato, francese, tedesco, italiano, giapponese, coreano, polacco, russo, spagnolo e svedese – da e verso l'inglese.
- Ne aggiungeremo altri in futuro. Per gli aggiornamenti, fare riferimento a Note sulla versione di Custom Translator.
Come funziona il dizionario neurale
Il dizionario neurale non utilizza l'esatta operazione di ricerca e sostituzione durante la gestione della traduzione della terminologia personalizzata. Invece, traduce termini o frasi dal dizionario in un modo che si adatta meglio all'intero contesto. Ciò significa che il termine può essere flesso o avere maiuscole e minuscole diverse, o che le parole circostanti possono essere adattate, producendo una traduzione più fluida e coerente.
Supponiamo, ad esempio, di avere la seguente frase di input in inglese e la sua traduzione in polacco senza frasi del dizionario è la seguente:
Immissione: | Abbiamo bisogno di una soluzione rapida che sia comprensibile. |
Traduzione standard: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Se vuoi assicurarti che "soluzione" sia tradotto come "alternatywa" ("un'alternativa" in inglese), è possibile aggiungere un'annotazione dinamica del dizionario per ottenere ciò:
Immissione: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Dizionario integrale: | Potrzebujemy szybkiego alternatywa, który będzie zrozumiały. |
Dizionario neurale: | Potrzebujemy szybkiej AlternanzaWy, którUn będzie zrozumiałUn. |
L'output prodotto dal metodo precedente non è fluente in quanto viene violata la coerenza grammaticale di genere. Il dizionario neurale produce un output fluente a) flettendo la sostituzione richiesta e b) modificando le parole circostanti dove necessario. In alcuni casi può anche cambiare la combinazione di maiuscole e minuscole, come nell'esempio seguente:
Immissione: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Dizionario integrale: | akcje Tej Firmy scherzare grazieNi. |
Dizionario neurale: | Akcje Tej Firmy są grazienie. |
Il dizionario neurale prevede che la traduzione richiesta di un termine sia fornita nella sua forma grammaticale di base. Sono supportati anche termini composti da più parole che devono essere forniti come sintagmi nominali, cioè le parole non devono essere lemmatizzate in modo indipendente (ad esempio, "Elezioni parlamentari estoni" sarà meglio di "Elezioni parlamentari estoni").
Come abilitare il dizionario neurale
Per tutte le lingue supportate elencate in precedenza, il dizionario neurale è immediatamente disponibile per tutti i clienti che utilizzano la piattaforma Custom Translator con Dizionari di frasi. Per abilitare il dizionario neurale è necessario ripetere il training completo del modello personalizzato (o solo dizionario).
Consigli
- Se si desidera assicurarsi che la voce del dizionario delle frasi venga utilizzata più spesso quando si lavora con il dizionario neurale, è possibile aggiungere la voce della frase con la parte di origine in varie forme. Nell'esempio precedente, accanto a "soluzione _ alternatywa", potresti voler aggiungere anche le seguenti voci: "Soluzione _ alternatywa", "soluzioni _ alternatywy", "Soluzioni _ alternatywy".
- Se l'obiettivo è garantire che una parola o una frase specifica venga copiata "così com'è" dal testo di input alla traduzione di output quando si utilizza il dizionario di frasi, è consigliabile applicare il dizionario verbatim in quanto potrebbe essere più coerente.
- Evita di aggiungere traduzioni di parole o frasi comuni o frequenti al dizionario delle frasi.
Per saperne di più su Custom Translator e su come può aiutare la tua azienda a prosperare nel mercato globale, inizia con il Guida per principianti di Custom Translator.
Operazioni che è possibile eseguire con Microsoft Custom Translator
Crea modelli personalizzati con la terminologia specifica del tuo dominio e traduci in tempo reale utilizzando il Microsoft Translator API.
Utilizzare Microsoft Custom Translator con le tue soluzioni di traduzione per aiutarti a globalizzare la tua attività e migliorare le interazioni con i clienti.
Per ulteriori informazioni, visitare il sito Soluzioni aziendali Microsoft Translator e Note sulla versione di Custom Translator.