Microsoft Custom Translator empurra a barra de qualidade de tradução para mais perto da paridade humana
A jornada do Tradutor Personalizado para estar na vanguarda da tecnologia de tradução automática continua.
No início de agosto de 2020, iniciamos a atualização do nosso Tradutor Personalizado de Memória de Curto Prazo Longa (também conhecido como LSTM) para a arquitetura de tradução de máquina neural (ou V1) do nosso Microsoft Translator para a arquitetura de última geração baseada em Transformador (ou V2). V2 é a mesma arquitetura de tradução que alimenta a API padrão não personalizada do Translator, assim como a tradução no Microsoft Office 365, Speech, Bing.com/translator, Edge, e muito mais.
O lançamento de agosto permitiu que os clientes utilizassem o dicionário (frase ou frase) tipo de documento para construir modelos personalizados em cima da plataforma V2 para uma rápida melhoria da qualidade da tradução sobre a plataforma V1.
Hoje, o Custom Translator completou a atualização completa da plataforma V2 para proporcionar um ganho de qualidade de tradução ainda maior do que antes. Os clientes podem agora construir modelos personalizados com todos os tipos de documentos (Training, Testing, Tuning, Phrase Dictionary e Sentence Dictionary) usando documentos de texto completo, como documentos Office, PDFs, HTML e texto simples.
Com este lançamento, empresas, pequenas e médias empresas, desenvolvedores de aplicativos e provedores de serviços linguísticos podem construir sistemas avançados de tradução neural personalizados que respeitam sua terminologia empresarial definida e integram perfeitamente esses sistemas em aplicativos, fluxos de trabalho e websites existentes ou novos para atrair clientes e fazer o negócio crescer.
Colocamos cada novo modelo linguístico de base através de um rigoroso processo de avaliação humana para garantir que a qualidade da tradução continue a cumprir os elevados padrões de qualidade em todos os domínios. No entanto, com sistemas de tradução especializados personalizados e treinados, os clientes podem alcançar uma adesão muito maior à terminologia e estilo específicos do domínio através do treinamento de um sistema de tradução personalizado em documentos previamente traduzidos e em domínio. Estes documentos previamente traduzidos permitem ao Tradutor Personalizado aprender as traduções preferidas no contexto, pelo que o Tradutor pode aplicar estes termos e frases quando o contexto o exigir, e produzir uma tradução fluente na língua alvo, respeitando a gramática dependente do contexto da língua alvo.
Benefícios da atualização
Nós usamos Pontuação Bleu (uma forma padrão na comunidade de pesquisa) para medir a qualidade de tradução de um modelo de base recém-formado. O ganho de um ou dois pontos BLEU é uma conquista digna de nota. A atualização da plataforma Custom Translator V2 proporcionará melhorias significativas quando comparada com a plataforma V1 anterior. O gráfico de barras abaixo mostra a melhoria da pontuação BLEU da qualidade da tradução para alguns domínios e o impacto do tamanho do conjunto de dados do treinamento.
Exemplos de domínios de tradução de qualidade BLEU ao usar o Translator padrão, Custom Translator V1, e Custom Translator V2.
Tamanho do conjunto de dados de formação em milhares ('auto-28k' significa 28.000 frases paralelas para o domínio automóvel)
É importante notar que a melhoria da qualidade real depende da qualidade dos dados do cliente, do tamanho do conjunto de dados de treinamento e da cobertura do domínio.
"Esperamos que a tradução através de uma rede neural não só aumente a qualidade e a velocidade, mas também ofereça avanços na avaliação de grandes dados". disse Nikolas Meyer-Aun, Chefe de Qualidade e Gestão de Fornecedores de Línguas da Volkswagen AG
O Tradutor Personalizado oferecerá atualização GRATUITA para a V2. Você pode fazer um novo modelo por projeto em um espaço de trabalho para a plataforma V2 sem nenhum custo. Quando você visualiza um projeto, você deve ver uma mensagem se você ainda tem crédito de upgrade gratuito para esse projeto. A oferta começa hoje e termina em 31 de janeiro de 2021. Após 31 de janeiro de 2021, os custos normais de treinamento se aplicam a cada treinamento de reciclagem.
Você pode saber mais sobre a atualização para a versão 2 na FAQ abaixo.
Perguntas Freqüentes
- O que você está liberando no V2?
Estamos lançando uma atualização da plataforma Custom Translator (V2) para oferecer melhorias significativas na qualidade da tradução usando a arquitetura de tradução automática neural de última geração da Microsoft. A experiência do usuário permanece a mesma que na V1. Não há nada de novo para aprender, apenas melhores traduções. Para uma rápida atualização, por favor veja isto Vídeo de Iniciação Rápida no YouTube. - Qual é a vantagem de atualizar um modelo atualmente implantado para a plataforma V2?
Qualidade de tradução significativamente melhorada; a atualização da plataforma Custom Translator V2 proporcionará uma melhoria significativa em relação ao Translator padrão e à plataforma V1 anterior. O gráfico de barras acima mostra as pontuações BLEU de qualidade de tradução para alguns domínios comuns e o impacto do tamanho do conjunto de dados de treinamento. - Como posso utilizar a minha actualização GRATUITA para o crédito V2?
Quando você visualiza os detalhes de um projeto, uma mensagem de crédito gratuita torna-se visível (veja as imagens abaixo) e continuará visível até que você refaça com sucesso um modelo ou a oferta termine em 31 de janeiro de 2021. - Como faço o upgrade dos meus modelos personalizados implementados (ou não) para a plataforma V2?
Se você tem um modelo de dicionário implantado ou não implantado que foi requalificado após 3 de agosto de 2020, ele já foi atualizado para a plataforma V2. Caso contrário, você deve lançar um novo modelo de treinamento. Assim que o novo modelo for treinado com sucesso, o botão "Swap" estará visível. Clique em "Swap" para implantar o novo modelo. Nota: O botão "Swap" permite a implantação sem tempo de parada. Ou seja, todos os pedidos de tradução continuarão a ser atendidos pelo modelo anterior até que o novo modelo seja implantado e funcional, então o novo modelo atenderá a novos pedidos de tradução e o modelo anterior não será implantado. - Posso continuar a implementar novamente modelos V1 personalizados após a actualização da plataforma V2?
Sim. Entendemos que pode haver razões para que os clientes queiram continuar usando modelos treinados na plataforma V1. Os modelos V1 podem funcionar na plataforma V2. Futuramente, os modelos V1 não poderão ser reimplantados. Nota: Uma vez que você faça a reciclagem de um modelo V1, o novo modelo estará na plataforma V2. A aba "Modelo" mostrará todos os modelos novos (V2) e os anteriores (V1). - Sou novo na personalização de traduções, como posso começar a usar o Custom Translator?
Para construir um modelo personalizado, assista ao vídeo Quick-Start acima e consulte a documentação em docs.microsoft.com: https://docs.microsoft.com/azure/cognitive-services/translator/custom-translator/overview
O que você pode fazer com o Microsoft Custom Translator
Construa modelos personalizados com a terminologia específica do seu domínio e traduza em tempo real usando a API do Microsoft Translator.
Utilize o Microsoft Custom Translator com as suas soluções de tradução para ajudar a globalizar o seu negócio e melhorar as interacções com os clientes.
Para mais informações sobre as soluções do Microsoft Translator, por favor visite: https://www.microsoft.com/translator/business.