Uma lata de metal (não pode?): Blog do convidado
Lee Schwartz é um linguista computacional da equipe do Microsoft Translator. O blog do convidado de hoje é sobre como se perder na tradução (automática)...
----------------------------
Recentemente, um usuário ficou chateado com a tradução que recebeu para uma lata de tinta de metal. Não é de se admirar. Quando ele traduziu isso para o espanhol, obteve uma pintura metálica podeo que significa uma tinta metálica é capaz de. E o que isso quer dizer? Mas, afinal, o que é "significado" para um sistema de tradução automática? Alguma coisa significa alguma coisa? Ou o computador está apenas vendo palavras combinadas em um idioma e palavras correspondentes em outro idioma? E ele está presumindo que, pelo fato de uma sequência ser usada no idioma de origem quando outra é usada no idioma de destino, uma é a tradução da outra? Mesmo que o programa de tradução automática esteja apenas vendo palavras combinadas, ele não teria visto lata de tinta antes e saber que o pode nesse contexto, é algum tipo de contêiner? Então, novamente, você pode ter certeza de que o computador por trás do programa de MT sabe alguma coisa sobre latas de tinta ou já viu essas duas palavras combinadas? Por que você acha que ele teria visto? Mas, dando a ele o benefício da dúvida, e supondo que ele saiba tudo sobre latas de tinta, ou pelo menos tenha visto a string lata de tinta muito, como ele pode saber como traduzir uma lata de tinta de metal? Talvez o computador tenha visto algo como A película metálica em um lado da placa... pode ser obtida por meio da pulverização de uma tinta metálica ou ....
Então, realmente existem tintas metálicas. E, se existem tintas metálicas, por que uma lata de tinta de metal ser a resposta para uma lata de tinta de metal, não é mesmo?? Bem, não é provável que, quando você tem as palavras pintura e pode em sequência, que pode significa ser capaz de. Mas, novamente, não é provável que pode significa qualquer coisa, menos ser capaz de. Acho que podemos dizer e pensar coisas que simplesmente não são prováveis. Posso entender facilmente o que Uma lata de tinta de metal pode, não pode? significa. O computador pode simplesmente pensar que eu digitei inadvertidamente pode duas vezes. Certamente, se ele aprender com dados reais, por exemplo, da Web, ele verá pode pode muito. Talvez seja por isso que ela não seja traduzida Ele fez a lata corretamente. Mas, na verdade, o que o inglês está fazendo com tantos tipos de latas mesmo assim? Podemos até mesmo fazer uma lata de minhocas, mas não vamos abrir essa agora.