Testiranje kakovosti prevajanja: gost blog
Anand Chakravarty je SDET na strojno prevajanje ekipa za zadnjih 2,5 let, je bil na Microsoft za 8 let, in je bil prvi izdelek tester na MT Team (in "še vedno zabavo s preskušanjem MT:-)"). Današnji gost blog je približno testiranje kakovosti prevajanja.
—————————————————————————————————————
Ena od prvih točk, ki pride na misel, ko govorimo o preverjanju kakovosti prevajalskega sistema, je, kako merite kakovost, ali biti natančen, natančnost prevajanja? Prevajanje med človeškimi jeziki, ki uporabljajo računalnike, je področje, ki je staro skoraj pol stoletja. Območje je dovolj zahtevno, da tudi najboljši trenutno razpoložljivi sistemi strojnega prevajanja niso blizu pridobivanju jezikovne kakovosti, ki bi bila popolnoma zadovoljiva.
Del izziva je veliko različnih podatkovnih točk, da je človek proces, da bi razumeli pomen govorjenega/pisnega besedila. Obstaja sintaksa, razčlenjevanju, semantika, kontekst, razločitev, preureditev, vse, ki, in še več, pojdite v razumevanju stavka. In to je samo stavek v 1 jeziku. Zdaj pa razmislite o uporabi vse to za obnovo stavka v drugem jeziku in da bo enako smiselna.
Nekateri primeri bi lahko pomagali, da bi to točko jasneje. Izraz "olimpijske igre 2008" je dokaj nedvoumna. Podobno lahko pričakujemo, da bo izraz "volitve 2008" pomenil Predsedniške volitve v ZDA. Vendar, če je uporabnik iz, recimo, Kanada, bi se bolj verjetno sklicujejo na lokalne volitve tam.
Bolj splošno, in zato bolj pogosta, primer je stavek, kot je "note je bilo narobe". Ali je beseda "note" sklic na informativno sporočilo ali glasbeni izraz? Ustrezen prevod je odvisen od konteksta. Uporabite več konteksta, in vaše možnosti za pridobivanje natančnejši prevod izboljšati. To pa prihaja po ceni: več kontekstu sistem poskuša pridobiti, počasnejši njegovo delovanje. Pametne ladijske odločitve vključujejo pravo ravnovesje med izboljšanjem natančnosti prevajanja in zagotavljanjem izvedljivega rezultata prevajanja uporabnikom. Seveda, oba sta pomembna. Ključno je razumeti, kje ste neposredna prizadevanja za izboljšanje glede na to, kako koristno je končni rezultat za uporabnika.
To postane še posebej zanimivo pri prevajanju dokumentov ali spletnih strani, namesto samo posameznih stavkov. Recimo, da je bila prošnja za prevod prejeta za spletno stran, ki vsebuje 100 stavkov. Glede na arhitekturo prevajalskega sistema, lahko ti stavki vsi gredo v en proces, ali se razdelijo v več procesih/stroji. V vsakem primeru je jasno, da je čas, ki je bil sprejet za prevajanje te strani v celoti, sorazmeren z največjim časom, ki je bil sprejet za prevajanje stavka. Kako dolgo bomo porabili prevajanje stavka pred tem vloženega časa postane škodljiva za čas uporabnika? V prizadevanju za najboljši prevod, bomo morda na koncu blokira uporabnika od pridobivanje nič informativnega v odgovor na njihovo zahtevo prevod. Uporabnost sistema tako urejajo odločitve, ki se izvajajo za uravnoteženje jezikovne kakovosti in učinkovitosti uporabe.
S mikroskop prevajalec zmnožek, je dodaten zunanja oblika od svoj dvojezični gledalec, nekaj edin med javno pri roki prevod zmnožek. Podpira vzporedno poudarjanje besedila, sinhronizirano drsenje in predstavlja stran (e) s postopnim upodabljanjem. To dodaja še plast, kaj naši uporabniki vidijo, in posledično še eno plast za nohte in konča.
V prihodnjih tednih upamo, da vam bomo prinesli več podrobnosti o določenih področjih, ki so bila in se preskušajo, da ladja vrhunski sistem prevajanja. Vas prosimo, da objavite vsa vprašanja, ki jih imate na to zadevo, nekaj, kar ste vedno želeli vprašati:-), v pripombah oddelku.