Prueba de calidad de traducción: blog invitado
Anand Chakravarty es un SDET en el equipo de traducción automática durante los últimos 2,5 años, ha estado en Microsoft durante 8 años, y fue el primer probador de productos en el equipo de MT (y "todavía divertirse con la prueba MT:-)"). Hoy en día el blog de invitados trata de probar la calidad de traducción.
—————————————————————————————————————
Uno de los primeros puntos que viene a la mente, cuando se habla de verificar la calidad de un sistema de traducción, es ¿cómo se mide la calidad, o para ser preciso, la exactitud de la traducción? Traducir entre lenguajes humanos utilizando computadoras es un campo de casi medio siglo de antigüedad. El área es lo suficientemente desafiante que incluso los mejores sistemas de traducción automática disponibles actualmente no están cerca de obtener la calidad lingüística que sería totalmente satisfactoria.
Parte del desafío son los muchos datos-puntos diferentes que los seres humanos procesan para entender el significado del texto hablado/escrito. Hay la sintaxis, el análisis, la semántica, el contexto, la desambiguación, el reordenamiento, todos los cuales, y más, entran en la comprensión de una frase. Y esto es sólo la frase en 1 idioma. Ahora considere la aplicación de todo para reconstruir la oración en otro idioma y hacerla igualmente significativa.
Algunos ejemplos podrían ayudar a aclarar este punto. El término ' Olimpiadas 2008 ' es bastante inequívoco. Del mismo modo, se podría esperar que el término "elecciones 2008" signifique las elecciones presidenciales en los Estados Unidos. Sin embargo, si el usuario es de, digamos, Canadá, es más probable que se refiera a las elecciones locales allí.
Un ejemplo más general, y por lo tanto más común, es una frase como ' la nota estaba equivocada '. ¿Es la palabra "Nota" una referencia a un mensaje informativo o a un término musical? La traducción adecuada depende del contexto. Utilice más contexto y sus posibilidades de obtener una traducción más precisa mejoran. Esto sin embargo viene en un coste: cuanto más contexto el sistema intenta obtener, más lento su funcionamiento. Las decisiones de envío inteligente implican hacer el equilibrio adecuado entre la mejora de la exactitud de la traducción y la entrega de un resultado de traducción viable a los usuarios. Por supuesto, ambos son importantes. La clave es entender dónde se dirigen los esfuerzos de mejora en función de lo útil que el resultado final es para el usuario.
Esto resulta particularmente interesante cuando se traducen documentos o páginas web, en lugar de oraciones individuales. Supongamos que se ha recibido una solicitud de traducción para una página web que contenga 100 oraciones. Dependiendo de la arquitectura del sistema de traducción, estas oraciones podrían ir a un proceso, o ser distribuidos a través de múltiples procesos/máquinas. De cualquier manera, está claro que el tiempo que se toma para traducir esta página en su totalidad es proporcional al tiempo máximo que se toma para traducir una frase. ¿Cuánto tiempo pasamos traduciendo una oración antes de que el tiempo invertido se convierta en perjudicial para el tiempo del usuario? En la búsqueda de la mejor traducción, podríamos terminar bloqueando al usuario de obtener algo informativo en respuesta a su solicitud de traducción. Así, la utilidad del sistema se rige por las decisiones que se hacen para equilibrar la calidad lingüística y el rendimiento de las aplicaciones.
Con el producto Microsoft Translator, existe la característica adicional de nuestro visualizador bilingüe, algo único entre los productos de traducción disponibles públicamente. Admite el resaltado de texto paralelo, el desplazamiento sincronizado y presenta la (s) página (es) con renderizado progresivo. Esto añade otra capa a lo que ven nuestros usuarios, y consecuentemente otra capa para pulir y terminar.
En las próximas semanas, esperamos traerle más detalles de áreas específicas que fueron y están siendo probadas para enviar un sistema de traducción de alta calidad. Siéntase libre de publicar cualquier pregunta que tenga sobre este asunto, algo que siempre quiso preguntar:-), en la sección Comentarios.