Microsoft Translator publiski izlaidumi runas tulkojums corpus
Christian Federmann, vecākais programmu vadītājs |
Kā daļu no pašreizējiem centieniem Microsoft uzlabot mākslīgā intelekta (AI) sistēmu precizitāti, Microsoft Translator ir publiski atbrīvojot datu kopums, kas ietver vairākas sarunas starp divvalodu runātājiem, kuri runā franču, Vācu un angļu valodā.
Šis corpus, kas tika ražots, Microsoft, izmantojot divvalodu speakers, mērķis ir izveidot standartu, ar kuru cilvēki var izmērīt, cik labi viņu sarunvalodas runu tulkošanas sistēmas darbu. To var izmantot kā standartizētu datu kopu, lai testētu divvalodu sarunvalodas runas tulkošanas sistēmas, piemēram, Microsoft Translator live funkcija Un Skype Translator.
Kristians Federmann, vecākais programmu vadītājs strādā ar Microsoft Translator komandu, teica, ka nav tik daudz standartizētu datu kopu testēšanai divvalodu sarunvalodas runas tulkošanas sistēmas. "Jums ir nepieciešams augstas kvalitātes datus, lai būtu augstas kvalitātes testēšana," Federmann teica.
Microsoft komanda cer, corpus, kas ir brīvi pieejams, gūs labumu visā jomā sarunvalodas tulkojumu un palīdz radīt vairāk standartizētu etaloniem, ka pētnieki var izmantot, lai novērtētu savu darbu pret citiem.
"Tas palīdz dzīt lauku uz priekšu," teica Vai Lewis, galvenais tehniskās programmas menedžeris ar Microsoft Translator komandu, kas arī strādāja pie projekta.
Lejupielādējiet Microsoft runas valodas tulkošanas korpusu šeit.
Uzziniet vairāk par šo laidienu, kā arī citiem veidiem, kā Microsoft strādā, lai padarītu AI gudrāku un precīzāku Microsoft Research emuārs.
Uzziniet Vairāk