"Microsoft Translator" duoda "end-to-end" kalbos vertimą visiems su pirmuoju pasaulyje kalbėjimo vertimo API
Šiandien mes išleido naują versiją Microsoft Translator API kuris prideda realaus laiko kalbos kalbėjimo (ir kalbos į tekstą) vertimo galimybes esamą teksto vertimo API. Naudojant "Microsoft" modernų dirbtinio intelekto technologijas, ši galimybė buvo prieinama milijonams vartotojų Skype daugiau nei metus, ir iOS Ir "Android" Vartotojai Microsoft Translator Apps nuo vėlyvo 2015. Dabar įmonės galės pridėti šias kalbėjimo vertimo galimybes savo taikomąsias programas ar paslaugas ir pasiūlyti daugiau fizinių ir veiksmingų vartotojų patirtį savo klientams ir darbuotojams.
Kalbos vertimas yra skirtas aštuonioms kalboms – Arabų, Kinų mandarinų, anglų, prancūzų, vokiečių, italų, portugalų ir ispanų kalbomis. Vertimas į tekstą yra prieinama visose Microsoft Translator ' s 50 + palaikomos kalbos. Vertimas į žodinio garso yra prieinamas 18 palaikomų kalbų.
Ši nauja versija Microsoft Translator yra pirmasis end-to-end kalbos vertimo sprendimas optimizuotas realaus gyvenimo pokalbius (vs paprastų žmonių mašinos komandas) galima rasti rinkoje. Prieš šiandien, kalbos vertimo sprendimai turi būti akmenimis kartu iš įvairių API (kalbėjimo atpažinimo, vertimo ir kalbos sintezės) skaičius, nebuvo optimizuotas šnekamoji kalba arba skirtos dirbti vieni su kitais. Dabar galutiniai vartotojai ir įmonės gali pašalinti kalbos barjerus, integruojantis kalbėjimo vertimą į pažįstamas programėles ir paslaugas.
Kaip mano įmonė gali naudoti kalbėjimo vertimo technologiją?
Kalbėjimo vertimas gali būti naudojamas įvairių asmenų, grupių ar "nuo žmogaus iki mašinos" scenarijuose. Asmenų su asmeniu scenarijai gali apimti vienpusio vertimo, pvz., asmeninio vertimo, subtitravimą, arba nuotolinio ar asmens daugiakalbės komunikacijos panašus į tai, kas šiuo metu rasti Skype vertėjas arba Microsoft Translator Apps iOS ir Android. Grupiniai scenarijai gali apimti realaus laiko pristatymus, pvz., įvykių keynotes, transliacijas internetu ir universitetų klases, arba susibūrimus, pvz., asmeniškai susitikimus ar internetinių lošimų pokalbių kambarius. "Human-to-Machine" scenarijuose gali būti verslo įžvalgų scenarijų (pvz., analizės arba klientų skambučių žurnalų) arba AI sąveikų.
Mes tik pradeda subraižyti scenarijų paviršių, kur ši technologija padės ir, kaip tai mašininio mokymosi pagrindu, jos kokybę ir todėl taikymas pagerins su laiku, kaip daugiau žmonių ir įmonių naudoja.
Keletas partnerių įmonės išbandyti API ir integruoti jį į savo programas:
- Tele 2 Švedijos, pirmaujanti mobiliojo ryšio operatoriaus su daugiau nei 15 000 000 abonentų daugiau nei 15 šalių, integruotas vertėjas į savo PBX remti realaus laiko telefono skambučius vertimai (ne App reikia!) savo korinio ryšio tinklo.
- LionBridge (Boston, MA), kalbos paslaugų teikėjas ir Gold lygio vertėjas partneris, sukūrė integruotą vaizdo subtitravimą sprendimas.
- ProDeaf, taikomosios programos pardavėjas specializuojasi kuriant technologijas remti sunku klausos ir Glusi bendruomenių, integruota naują API į savo gestų kalbos avatar App, kad daugiakalbės paramos kalboje pasirašyti scenarijai.
Kaip veikia kalbos vertimas?
Kalbos vertimas į kalbą yra labai sudėtingas uždavinys. Jis naudoja naujausias PG technologijas, tokias kaip gilūs Neuroniniai tinklai kalbėjimo atpažinimui ir teksto vertimui. Nėra jokių kitų visiškai integruotos kalbos vertimo sprendimą galima rasti rinkoje šiandien ir teikti platformą, kuri padėtų realaus gyvenimo kalbos vertimo scenarijai reikalaujama vyksta ne tik tiesiog susiuvimo kartu esamas kalbos atpažinimo ir teksto vertimo technologijomis. Yra keturi etapai į kalbos vertimą, kad būtų galima pristatyti šią patirtį:
- Automatinis kalbėjimo atpažinimas (ASR) — Gilus neuroninis tinklas, apmokyti tūkstančius valandų garso analizuoja gaunamus kalboje. Šis modelis yra apmokyti žmogaus į žmogaus sąveiką, o ne iš žmogaus į mašiną komandas, gaminančių kalbos atpažinimo, kad yra optimizuotas normalus pokalbius.
- TekstasJeiTiesa "Microsoft" mokslinių tyrimų naujovės, TrueText užima pažodinis tekstas ir transformuoja jį atidžiau atspindėti vartotojo ketinimų. Jis pasiekia tai, pašalinant kalbos disfluencies, pavyzdžiui, "UM" s ir "Ah" s, taip pat stostās ir pakartojimų. Tekstas taip pat yra labiau įskaitomas ir išverčiamas pridedant sakinio pertraukas, tinkamą skyrybos ženklą ir didžiųjų raidžių rašybą. (žr. paveikslėlį žemiau)
- Vertimas Tekstas išverstas į bet kurią iš "Microsoft Translator" palaikomų 50 + kalbų. Aštuoni kalbos kalbos buvo toliau optimizuotas pokalbiai mokymo milijonai žodžių šnekamoji duomenis, naudojant gilius neuronų tinklų Powered kalbos modelius.
- Tekstas į kalbą — Jei tikslinė kalba yra viena iš aštuoniolikos kalbėjimo kalbų, tekstas konvertuojamas į kalbos išvestį, naudojant kalbos sintezę. Šis etapas praleidžiamas kalbos ir teksto vertimo scenarijuose, pvz., vaizdo įrašų subtitravimą.
Kaip pradėti?
Tai lengva pradėti su nauja Microsoft Translator kalbėjimo API. Nemokamu 10 valandų trukmės bandomuoju aka.ms/TranslatorADMSpeech. Galite išbandyti sąranką ir diegimą virtualioje aplinkoje, taip pat perskaityti API dokumentaciją apie mūsų naują Swagger puslapis. Taip pat galite rasti programų pavyzdžių ir kitos naudingos informacijos apie Github.
Žinoma, jei turite klausimų, klausimų ar atsiliepimų, mes norėtume išgirsti jį! Galite mums pranešti apie mūsų grįžtamasis ryšys ir pagalbos forumas.
Sužinokite Daugiau