Microsoftov prevodilac dovodi do kraja prevođenju govora svima sa prvim API na svijetu za prevođenje govora
Danas smo objavili novu verziju API za prevodioca Microsofta to dodaje u realnom vremenu govor (i govor na tekst) za prevođenje u postojeću poruku o prevođenju teksta. Pogonjena od strane Microsoftove najmodernije obavještajne tehnologije, ova sposobnost je dostupna milionima korisnika Skype više od godinu dana, i da iOS I Android Korisnici Microsoftovih aplikacija za prevodioca od kasnih 2015. Sad će preduzeća moći dodati te sposobnosti prevođenja govora na svoje aplikacije ili usluge i ponuditi više prirodnih i djelotvornih korisničkih iskustava svojim mušterijama i osobljem.
Prevod govora je dostupan za osam jezika. Arapski, Kineski mandarinski, engleski, francuski, njemački, italijanski, Portugalac i španski. Prevod na tekst je dostupan u svim aplikaciji Microsoft prevodioca 50 + podržanih jezika. Prevod na izgovorena audio je dostupan na 18 podržanih jezika.
Ova nova verzija Microsoftovog prevodioca je prvi kraj rješenja za prevođenje govora koji je optimiziran za stvarne razgovore (naspram jednostavnog ljudskog do komandama mašina) dostupno na tržištu. Prije današnjeg dana, rješenja za prevođenje govora morali su se spojiti iz niza različitih Apata (prepoznavanje govora, Prevod i obrada govora), nisu bili optimizirani za konverzacijski govor ili dizajnirani da rade jedni s drugima. Sad, okončanju korisnika i preduzeća mogu ukloniti jezičke barijere s integracijom prevođenja govora u njihovim poznatim aplikacijama i uslugama.
Kako moj posao može da koristi tehnologiju prevođenja govora?
Prevođenje govora može se koristiti u raznim raznovrsnim ljudima, grupnim ili ljudskim scenarijima. Scenariji osoba na osobu možda uključuju jednostranačku prevođenje, kao što je lični Prevod, podstrek, ili daljinski ili neki multi-Jezična komunikacija sličan onome što je trenutno nađeno u prevođenju Skype-a ili Microsoft aplikacijama za prevodilačku aplikaciju za iOS i Android. Grupne scenarije mogu uključivati prezentacije u realnom vremenu poput tipki za događaje, web-puta i univerzitetske klase, ili okupljanja poput. Scenariji ljudskih i mašina mogli bi uključivati scenarije poslovnih informacija (poput analize ili poziva na pozive ili zapise korisnika) ili AI interakcije.
Tek smo počeli da grebeš površinu scenarija gdje će ova tehnologija pomoći i, jer je na osnovu mašine koje uče, njena kvaliteta i stoga će se primjenljivost poboljšati vremenom dok ga koriste više ljudi i kompanija.
Nekoliko partnerih kompanija testirano je API i integriralo ga u svoje aplikacije:
- Tele-2 Švedske, vodećeg mobilnog operatera sa preko 15.000.000 pretplatnika u preko 15 zemalja, integrisani prevodilac u svoj PBX kako bi podržali prevođenje poziva u realnom vremenu (nijedna Aplikacija nije potrebna!) na njihovoj ćelijskom mreži.
- LionBridge (Boston, mama), provajder jezičkih usluga i prevoditelj zlatnog nivoa, razvio je integrisani video-subtitiranje rješenja.
- Progluh, prodavač aplikacije specijaliziran za razvijanje tehnologija u cilju podrške za teško slušanje i gluhe zajednice, integrirao je novi API u aplikaciju za Avatarski jezik avatar da omogući višejezičku podršku govora u cilju potpisutih scenarija.
Kako ide prevođenje govora?
Prijevod na govor je veoma složen izazov. Ona koristi najnovije AI tehnologije, poput dubokih neuralnih mreža za prepoznavanje govora i prevođenje teksta. Nema drugog sasvim integrisanog prevođenja govora koji je dostupan na tržištu danas i isporučuje platformu koja bi podržala scenarije za prevođenje govora koje su potrebne da bi se na kraju sašivali i. prevođenje tehnologije. Postoje četiri faze u prevodu govora da bi mogli da isporučimo ovo iskustvo:
- Automatsko prepoznavanje govora (ASR) — Duboka neuralna mreža obučavana na hiljade sati audio analize. Ovaj model je obuиen na interakcije ljudskog ljudskog иovjeka, a ne za komande ljudskih i maљina, proizvodeci prepoznavanje govora koje je Optimizovano za normalne razgovore.
- Truetekst — Microsoftova istraživačka inovacija, Truetekst uzima doslovno tekst i transformira je u pažljivije odražavaju korisničku namjeru. Ona ostvari ovo uklanjanjem razgovora o govoru, poput "um" i "Ah", kao i stutterova i ponavljanja. Tekst je također spremniji i prevodljiv, dodajući pauze za kaznu, propisnu interpunaciju i kapitalizaciju. (vidi sliku ispod)
- Prevod Tekst je preveden na bilo koji od 50 + jezika koje podržava Microsoft prevodilac. Osam jezika govora dodatno je Optimizovano za razgovore obučeno na milione riječi razgovornih podataka koristeći duboke neuralne mreže jezičkih modela.
- Tekst govoru. Ako je ciljani jezik jedan od 18 jezika koje podržava govor, tekst se pretvara u govornu proizvodnju govora koristeći sintezu govora. Ovaj stadijum je izostavljeno u govoru o prevođenju teksta kao što je video Subtitling.
Kako da počnem?
Lako je početi sa novim Microsoft API govorom za prevodjenje. Slobodno 10-satno suđenje je dostupno u aka.ms/TranslatorADMSpeech. Možete testirati postavljanje i implementaciju u virtualnom okruženju, kao i pročitati API-dokumentaciju o našem novom Swagger Page. Također možete pronaći primjerne aplikacije i druge korisne informacije o GitHub.
Naravno, ako imate pitanja, pitanja, ili povratne informacije, voleli bismo da je čujemo! Možete nam reći o našem forum za povratne informacije i podršku.
Naučiti Više