Dicionário Neural do Tradutor Personalizado de IA do Azure: Oferecendo maior qualidade de tradução de terminologia
Hoje, estamos muito animados em anunciar o lançamento do dicionário neural, um aprimoramento significativo da qualidade da tradução em nossa plataforma. Nesta postagem do blog, exploraremos o recurso do dicionário neural.
Introdução
O dicionário neural é uma extensão do nosso dicionário dinâmico e dicionário de frases no Tradutor de IA do Azure. Ambos permitem que nossos usuários personalizem o resultado da tradução, fornecendo suas próprias traduções para termos ou frases específicos. Nosso método anterior usava o dicionário literal, que era uma operação exata de localizar e substituir. O dicionário neural melhora a qualidade da tradução de frases que podem incluir uma ou mais traduções de termos, permitindo que o modelo de tradução automática ajuste o termo e o contexto para produzir uma tradução mais fluente. Ao mesmo tempo, ele preserva a alta precisão da tradução de termos.
O exemplo inglês-alemão a seguir demonstra as diferenças nos resultados de tradução entre os dois métodos quando uma tradução de terminologia personalizada é solicitada:
Entrada: | Basic Knowledge of <mstrans:dictionary translation=”regelmäßiges Testen”>Periodic Maintenance</mstrans:dictionary> |
Dicionário Verbatim: | Fundamentos der Regelmäßiges Testeen |
Dicionário neural: | Fundamentos des Regelmäßigen Testeens |
Melhoria da qualidade
O gráfico abaixo ilustra as melhorias significativas que o novo recurso traz em conjuntos de testes de terminologia comuns disponíveis publicamente no setor automotivo (https://aclanthology.org/2021.eacl-main.271), Saúde (https://aclanthology.org/2021.emnlp-main.477) e os domínios da Covid-19 (https://aclanthology.org/2021.wmt-1.69) usando nossos modelos gerais de tradução.
Também realizamos uma série de avaliações de clientes na plataforma Custom Translator e nos modelos de dicionário neural. Medimos os ganhos de qualidade de tradução nos dados do cliente entre modelos com e sem a extensão do dicionário neural. Cinco clientes participaram, abrangendo alemão, espanhol e francês em diferentes domínios de negócios.
O gráfico abaixo mostra a melhoria média de COMET no domínio educacional para inglês-alemão, inglês-espanhol e inglês-francês; para modelos gerais à esquerda e para modelos personalizados à direita. As barras de cor AZUL representam a qualidade geral da tradução sem dicionário neural e as barras de cor LARANJA representam a qualidade da tradução usando o dicionário neural. Essas são as melhorias médias gerais em todos os conjuntos de teste. Para segmentos que incluem uma ou mais entradas do dicionário do cliente (entre 19% e 63%), a melhoria chega a +6,3 a +12,9 pontos COMET.
Idiomas suportados
- Atualmente disponível (a partir de 6 de dezembro de 2023): Chinês simplificado, francês, alemão, italiano, japonês, coreano, polonês, russo, espanhol e sueco - de e para o inglês.
- Estamos adicionando mais no futuro. Para obter atualizações, consulte Notas de versão do Custom Translator.
Como funciona o dicionário neural
O dicionário neural não emprega a operação exata de localizar e substituir ao lidar com a tradução de terminologia personalizada. Em vez disso, ele traduz termos ou frases do dicionário de uma forma que se adapte melhor a todo o contexto. Isso significa que o termo pode ser flexionado ou ter uma forma diferente, ou que as palavras ao redor podem ser ajustadas, produzindo uma tradução mais fluente e coerente.
Digamos, por exemplo, que temos a seguinte frase de entrada em inglês e sua tradução para o polonês sem nenhuma frase de dicionário é a seguinte:
Entrada: | Precisamos de uma solução rápida que seja compreensível. |
Tradução padrão: | Potrzebujemy szybkiego rozwiązania, które będzie zrozumiałe. |
Se você quiser ter certeza de que "solution" seja traduzido como "alternatywa" ("uma alternativa" em inglês), você pode adicionar uma anotação de dicionário dinâmico para conseguir isso:
Entrada: | We need a fast <mstrans:dictionary translation=”alternatywa“>solution</mstrans:dictionary> that will be understandable. |
Dicionário Verbatim: | Perguntas frequentesego alternatywa, który będzie zrozumiały. |
Dicionário neural: | Perguntas frequentesej alternânciawy, która będzie zrozumiała. |
O resultado produzido pelo método anterior não é fluente, pois a consistência do gênero gramatical é violada. O dicionário neural produz um resultado fluente ao a) flexionar a substituição solicitada e b) alterar as palavras ao redor quando necessário. Ele também pode alterar a caixa em alguns casos, como no exemplo a seguir:
Entrada: | This company’s <mstrans:dictionary translation=”akcje“>stock</mstrans:dictionary> is cheap. |
Dicionário Verbatim: | akcje tej firmy brincadeira tani. |
Dicionário neural: | Akcje tej firmy są tabom. |
O dicionário neural espera que a tradução solicitada de um termo seja fornecida em sua forma gramatical básica. Termos com várias palavras também são suportados e devem ser fornecidos como frases nominais, ou seja, as palavras não devem ser lematizadas independentemente (por exemplo, "Estonian parliamentary election" será melhor do que "Estonia parliament election").
Como ativar o dicionário neural
Para todos os idiomas suportados listados acima, o dicionário neural está imediatamente disponível para todos os clientes que usam a plataforma do Custom Translator com dicionários de frases. O retreinamento completo (ou somente do dicionário) do modelo personalizado é necessário para ativar o dicionário neural.
Recomendações
- Se você quiser garantir que a entrada do dicionário de frases seja usada com mais frequência ao trabalhar com o dicionário neural, considere adicionar a entrada da frase com a parte de origem em várias formas. No exemplo acima, ao lado de "solution _ alternatywa", talvez você queira adicionar também as seguintes entradas: "Solução _ alternatywa", "soluções _ alternativo", "Soluções _ alternativo".
- Se o objetivo for garantir que uma palavra ou frase específica seja copiada "como está" do texto de entrada para a tradução de saída ao usar o dicionário de frases, considere aplicar o dicionário literal, pois ele pode ser mais consistente.
- Evite adicionar traduções de palavras ou frases comuns ou frequentes ao dicionário de frases.
Para saber mais sobre o Custom Translator e como ele pode ajudar sua empresa a prosperar no mercado global, comece com o Guia para iniciantes do Custom Translator.
O que você pode fazer com o Microsoft Custom Translator
Crie modelos personalizados com a terminologia específica de seu domínio e traduza em tempo real usando o API do Microsoft Translator.
Uso Tradutor personalizado da Microsoft com suas soluções de tradução para ajudar a globalizar seus negócios e melhorar as interações com os clientes.
Para obter mais informações, visite Soluções de negócios do Microsoft Translator e Notas de versão do Custom Translator.