Pular para o conteúdo principal
Tradutor

Blog do Microsoft Translator

Dicionário Neural do Tradutor Personalizado de IA do Azure: Oferecendo maior qualidade de tradução de terminologia 

Hoje, estamos muito animados em anunciar o lançamento do dicionário neural, um aprimoramento significativo da qualidade da tradução em nossa plataforma. Nesta postagem do blog, exploraremos o recurso do dicionário neural.

Introdução  

O dicionário neural é uma extensão do nosso dicionário dinâmico e dicionário de frases no Tradutor de IA do Azure. Ambos permitem que nossos usuários personalizem o resultado da tradução, fornecendo suas próprias traduções para termos ou frases específicos. Nosso método anterior usava o dicionário literal, que era uma operação exata de localizar e substituir. O dicionário neural melhora a qualidade da tradução de frases que podem incluir uma ou mais traduções de termos, permitindo que o modelo de tradução automática ajuste o termo e o contexto para produzir uma tradução mais fluente. Ao mesmo tempo, ele preserva a alta precisão da tradução de termos.  

O exemplo inglês-alemão a seguir demonstra as diferenças nos resultados de tradução entre os dois métodos quando uma tradução de terminologia personalizada é solicitada: 

Entrada:   Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary>   
Dicionário Verbatim:   Fundamentos der Regelmäßiges Testeen 
Dicionário neural:   Fundamentos des Regelmäßigen Testeens 

Melhoria da qualidade 

O gráfico abaixo ilustra as melhorias significativas que o novo recurso traz em conjuntos de testes de terminologia comuns disponíveis publicamente no setor automotivo (https://aclanthology.org/2021.eacl-main.271), Saúde (https://aclanthology.org/2021.emnlp-main.477) e os domínios da Covid-19 (https://aclanthology.org/2021.wmt-1.69) usando nossos modelos gerais de tradução. 

Também realizamos uma série de avaliações de clientes na plataforma Custom Translator e nos modelos de dicionário neural. Medimos os ganhos de qualidade de tradução nos dados do cliente entre modelos com e sem a extensão do dicionário neural. Cinco clientes participaram, abrangendo alemão, espanhol e francês em diferentes domínios de negócios.

O gráfico abaixo mostra a melhoria média de COMET no domínio educacional para inglês-alemão, inglês-espanhol e inglês-francês; para modelos gerais à esquerda e para modelos personalizados à direita. As barras de cor AZUL representam a qualidade geral da tradução sem dicionário neural e as barras de cor LARANJA representam a qualidade da tradução usando o dicionário neural. Essas são as melhorias médias gerais em todos os conjuntos de teste. Para segmentos que incluem uma ou mais entradas do dicionário do cliente (entre 19% e 63%), a melhoria chega a +6,3 a +12,9 pontos COMET. 

 Idiomas suportados  

  • Atualmente disponível (a partir de 6 de dezembro de 2023): Chinês simplificado, francês, alemão, italiano, japonês, coreano, polonês, russo, espanhol e sueco - de e para o inglês.  
  • Estamos adicionando mais no futuro. Para obter atualizações, consulte Notas de versão do Custom Translator 

Como funciona o dicionário neural 

O dicionário neural não emprega a operação exata de localizar e substituir ao lidar com a tradução de terminologia personalizada. Em vez disso, ele traduz termos ou frases do dicionário de uma forma que se adapte melhor a todo o contexto. Isso significa que o termo pode ser flexionado ou ter uma forma diferente, ou que as palavras ao redor podem ser ajustadas, produzindo uma tradução mais fluente e coerente.  

Digamos, por exemplo, que temos a seguinte frase de entrada em inglês e sua tradução para o polonês sem nenhuma frase de dicionário é a seguinte:  

Entrada:   Precisamos de uma solução rápida que seja compreensível.  
Tradução padrão:   Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe.  

Se você quiser ter certeza de que "solution" seja traduzido como "alternatywa" ("uma alternativa" em inglês), você pode adicionar uma anotação de dicionário dinâmico para conseguir isso:  

Entrada:   We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable.  
Dicionário Verbatim:   Perguntas frequentesego alternatywa, który będzie zrozumiały.  
Dicionário neural:   Perguntas frequentesej alternânciawy, która będzie zrozumiała.  

O resultado produzido pelo método anterior não é fluente, pois a consistência do gênero gramatical é violada. O dicionário neural produz um resultado fluente ao a) flexionar a substituição solicitada e b) alterar as palavras ao redor quando necessário. Ele também pode alterar a caixa em alguns casos, como no exemplo a seguir:  

Entrada:   This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap.  
Dicionário Verbatim:   akcje tej firmy brincadeira tani.  
Dicionário neural:   Akcje tej firmy tabom.   

O dicionário neural espera que a tradução solicitada de um termo seja fornecida em sua forma gramatical básica. Termos com várias palavras também são suportados e devem ser fornecidos como frases nominais, ou seja, as palavras não devem ser lematizadas independentemente (por exemplo, "Estonian parliamentary election" será melhor do que "Estonia parliament election"). 

Como ativar o dicionário neural 

Para todos os idiomas suportados listados acima, o dicionário neural está imediatamente disponível para todos os clientes que usam a plataforma do Custom Translator com dicionários de frases. O retreinamento completo (ou somente do dicionário) do modelo personalizado é necessário para ativar o dicionário neural. 

 Recomendações 

  1. Se você quiser garantir que a entrada do dicionário de frases seja usada com mais frequência ao trabalhar com o dicionário neural, considere adicionar a entrada da frase com a parte de origem em várias formas. No exemplo acima, ao lado de "solution _ alternatywa", talvez você queira adicionar também as seguintes entradas: "Solução _ alternatywa", "soluções _ alternativo", "Soluções _ alternativo".  
  2. Se o objetivo for garantir que uma palavra ou frase específica seja copiada "como está" do texto de entrada para a tradução de saída ao usar o dicionário de frases, considere aplicar o dicionário literal, pois ele pode ser mais consistente.   
  3. Evite adicionar traduções de palavras ou frases comuns ou frequentes ao dicionário de frases.  

Para saber mais sobre o Custom Translator e como ele pode ajudar sua empresa a prosperar no mercado global, comece com o Guia para iniciantes do Custom Translator. 

O que você pode fazer com o Microsoft Custom Translator 

Crie modelos personalizados com a terminologia específica de seu domínio e traduza em tempo real usando o API do Microsoft Translator. 

Uso Tradutor personalizado da Microsoft com suas soluções de tradução para ajudar a globalizar seus negócios e melhorar as interações com os clientes. 

Para obter mais informações, visite Soluções de negócios do Microsoft Translator e Notas de versão do Custom Translator.