Dicionário Neural do Tradutor Personalizado de IA do Azure: Proporcionando maior qualidade de tradução de terminologia
Hoje, estamos muito entusiasmados por anunciar o lançamento do dicionário neural, uma melhoria significativa da qualidade da tradução na nossa plataforma. Nesta publicação do blogue, vamos explorar a funcionalidade do dicionário neural.
Introdução
O dicionário neural é uma extensão do nosso dicionário dinâmico e dicionário de frases no Tradutor de IA do Azure. Ambas permitem que os nossos utilizadores personalizem o resultado da tradução, fornecendo as suas próprias traduções para termos ou frases específicos. O nosso método anterior utilizava o dicionário literal, que era uma operação exacta de localização e substituição. O dicionário neural melhora a qualidade da tradução de frases que podem incluir uma ou mais traduções de termos, permitindo que o modelo de tradução automática ajuste tanto o termo como o contexto para produzir uma tradução mais fluente. Ao mesmo tempo, preserva a elevada precisão da tradução de termos.
O exemplo inglês-alemão a seguir demonstra as diferenças nos resultados de tradução entre os dois métodos quando uma tradução de terminologia personalizada é solicitada:
Entrada: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Dicionário Verbatim: | Fundamentos der RegelmäßigEs Testeen |
Dicionário neural: | Fundamentos des Regelmäßigen Testeens |
Melhoria da qualidade
O gráfico abaixo ilustra as melhorias significativas que a nova funcionalidade traz aos conjuntos de testes terminológicos comuns publicamente disponíveis no sector automóvel (https://aclanthology.org/2021.eacl-main.271), Saúde (https://aclanthology.org/2021.emnlp-main.477) e os domínios Covid-19 (https://aclanthology.org/2021.wmt-1.69) utilizando os nossos modelos gerais de tradução.
Também realizámos uma série de avaliações de clientes na plataforma Custom Translator e nos modelos de dicionário neural. Medimos os ganhos de qualidade de tradução em dados de clientes entre modelos com e sem a extensão de dicionário neural. Participaram cinco clientes, abrangendo alemão, espanhol e francês em diferentes domínios de negócio.
O gráfico abaixo mostra a melhoria média de COMET no domínio da educação para inglês-alemão, inglês-espanhol e inglês-francês; para modelos gerais, à esquerda, e para modelos personalizados, à direita. As barras de cor AZUL representam a qualidade geral da tradução sem dicionário neural e as barras de cor LARANJA representam a qualidade da tradução com dicionário neural. Estas são melhorias médias gerais em todos os conjuntos de teste. Para os segmentos que incluem uma ou mais entradas do dicionário do cliente (entre 19% e 63%), a melhoria é tão elevada como +6,3 a +12,9 pontos COMET.
Idiomas suportados
- Atualmente disponíveis (a partir de 6 de dezembro de 2023): Chinês simplificado, francês, alemão, italiano, japonês, coreano, polaco, russo, espanhol e sueco - de e para inglês.
- Estamos a acrescentar mais no futuro. Para obter actualizações, consulte Notas de lançamento do Custom Translator.
Como funciona o dicionário neural
O dicionário neural não emprega a operação exacta de localizar e substituir ao lidar com a tradução de terminologia personalizada. Em vez disso, traduz termos ou frases do dicionário de uma forma que se adapte melhor a todo o contexto. Isto significa que o termo pode ser flexionado ou ter um revestimento diferente, ou que as palavras circundantes podem ser ajustadas, produzindo uma tradução mais fluente e coerente.
Digamos, por exemplo, que temos a seguinte frase de entrada em inglês e a sua tradução para polaco, sem qualquer dicionário de frases, é a seguinte
Entrada: | Precisamos de uma solução rápida que seja compreensível. |
Tradução normalizada: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Se quiser ter a certeza de que "solution" é traduzido como "alternatywa" ("uma alternativa" em inglês), pode adicionar uma anotação de dicionário dinâmico para o conseguir:
Entrada: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Dicionário Verbatim: | Perguntas frequentesego alternatywa, który będzie zrozumiały. |
Dicionário neural: | Perguntas frequentesej alternânciawy, którUm będzie zrozumiałUm. |
O resultado produzido pelo método anterior não é fluente, uma vez que a consistência do género gramatical é violada. O dicionário neural produz um resultado fluente a) inflectindo a substituição pedida e b) alterando as palavras circundantes quando necessário. Nalguns casos, também pode alterar o maiúsculas e minúsculas, como no exemplo seguinte:
Entrada: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Dicionário Verbatim: | akcje tej firmy brincadeira tani. |
Dicionário neural: | Akcje tej firmy są tabom. |
O dicionário neural espera que a tradução solicitada de um termo seja fornecida na sua forma gramatical de base. Os termos com várias palavras também são suportados e devem ser fornecidos como sintagmas nominais, ou seja, as palavras não devem ser lematizadas de forma independente (por exemplo, "Estonian parliamentary election" será melhor do que "Estonia parliament election").
Como ativar o dicionário neural
Para todas as línguas suportadas listadas acima, o dicionário neural está imediatamente disponível para todos os clientes que utilizam a plataforma Custom Translator com dicionários de frases. Para ativar o dicionário neural, é necessário um novo treino completo (ou apenas do dicionário) do modelo personalizado.
Recomendações
- Para garantir que a entrada do dicionário de frases seja usada com mais freqüência ao trabalhar com o dicionário neural, é possível adicionar a entrada da frase com a parte de origem, de várias formas. No exemplo acima, ao lado de "solução _ alternatywa", pode querer adicionar também as seguintes entradas: "Solução _ alternatywa", "soluções _ alternativo", "Soluções _ alternativo".
- Se o objetivo é garantir que uma palavra ou frase específica é copiada "tal e qual" do texto de entrada para a tradução de saída quando se usa o dicionário de frases, considere aplicar o dicionário literal, pois pode ser mais consistente.
- Evite acrescentar traduções de palavras ou frases comuns ou frequentes ao dicionário de frases.
Para saber mais sobre o Custom Translator e como ele pode ajudar sua empresa a prosperar no mercado global, comece com o Guia para principiantes do Custom Translator.
O que você pode fazer com o Microsoft Custom Translator
Crie modelos personalizados com a terminologia específica do seu domínio e traduza em tempo real utilizando o API do Microsoft Translator.
Usar Tradutor Personalizado da Microsoft com as suas soluções de tradução para ajudar a globalizar a sua empresa e melhorar as interacções com os clientes.
Para mais informações, visitar Soluções empresariais do Microsoft Translator e Notas de lançamento do Custom Translator.