A végpontok közötti beszédfordítás integrálása a Microsoft beszédszolgáltatások segítségével
A Microsoft beszédszolgáltatások mostantól általában rendelkezésre állnak. Az Azure kognitív szolgáltatások egy része, a beszéd teljes beszédszolgáltatást kínál, beleértve a beszédfelismerést, a fordítást, valamint az egységesített és testreszabható szolgáltatások egy-egy halmazában történő szövegfelolvasás funkciókat. Egyesíti a Microsoft Translator Speech API, a Bing Speech API és az egyéni beszédszolgáltatások (előnézet) lehetőségeit.
A beszéd kész és skálázható az Ön igényei szerint, a prototípusból a termeléshez. Alkalmazásokat, webhelyeket és munkafolyamatokat adhat hozzá egy Azure Előfizetés.
A beszédfelismerés támogatja az 11 beszéddé fordító nyelvet. E 11 nyelv bármelyikén történő beszéd több mint 60 nyelven is lefordítható. A fordítás, a beszédfelismerés és a szövegfelolvasás támogatott nyelvének listája megtalálható a Beszédszolgáltatások dokumentációja.
Testreszabható végpontok közötti megoldás
A Microsoft Translator Speech API-hoz hasonlóan a beszédfordítási szolgáltatás egyesíti a beszédfordításhoz szükséges összes elemet egyetlen integrált szolgáltatás keretében: a beszédfelismerést, beleértve a TrueText szövegnormalizálást, a szövegfordítást a Microsoft fordító szolgáltatás és szöveg-beszéd átalakítás.
Ezen kívül a beszédfordítások minden szinten testreszabhatók a beszédfelismerést a szövegfelolvasás és a kimenet között.
Beszédfelismerési és TrueText normalizálás: hanganyag konvertálása szöveggé
A beszédhang feldolgozásra kerül, és nyers szöveges kimenetté alakul át. Után a beszéd van megtérít, TrueText normalizálja a szöveget, annak érdekében, hogy megfelelőbb a fordítást. TrueText eltávolítja beszéd disfluencies (töltelék szavakat, mint a "UM" és az "ah"-ok), akadozik, és ismétlések. A szöveg is tenni olvashatóbb és lefordítható hozzáadásával mondat szünetek, megfelelő írásjelek, és a nagybetűs.
A beszédfelismerés testreszabható a Egyéni beszédszolgáltatások. -Val szokás beszéd, használók tud épít szokás nyelv minták szabott-hoz-uk saját szókincs és egyedülálló beszélő stílus. Egyéni akusztikus modellek is létre, hogy alkalmazkodjanak a felhasználói környezet, hogy ellenőrizze, hogy a beszédfelismerés képes alkalmazkodni a különböző mikrofonok, mintavételi sebesség vagy a háttérzaj.
Gépi fordítás: lefordítani a szöveget
A konvertált szöveg fordítása segítségével neurális gépi fordítás speciálisan kifejlesztett, a valós életben beszélt beszélgetések.
Egyéni fordítói előnézet lehetővé teszi a felhasználók számára, hogy testre Translator neurális fordítási rendszerek egyik, hogy megérti a terminológiát használják a vállalat vagy az ipar.
A Custom Translator szolgáltatással testreszabott rendszerek mind beszédfordításokhoz, mind szövegfordításra használhatók Microsoft fordító Text API.
Text-to-Speech: termék audio a lefordított szöveg
Szöveg--hoz-beszéd, vagy hang szintézis, teremt számítógép-létrehoz audio termelés-ból lefordított szöveg. Használók tud választ-ból több mint 75 hangok-ban felső 45 nyelvek vagy locales, beleértve választások részére hím és nő hang.
A Egyéni hangvezérlés, használók tud is megszokott a hang mellett regisztráló készülék és feltölt képzés adat. A szolgáltatás egyedi hangparancsokat hoz létre a felvételekhez.
A kezdéshez az egyesített beszéd
Tudjon meg többet az egységes beszéd a szolgáltatás Azúr oldal. Ott, tudod teszt ki Microsofts ' egyesített beszéd szolgáltatás részére szabad-val egy 30 nap próba-kulcs átmenő a Azúrkék portál.
A beszédfelismerési dokumentáció elérhető itt, és tele van a gyors elindul, útmutatók, és hogyan útmutatók, hogy segítsen hozzá a szolgáltatás-hoz-a app.