Microsoft Translator prináša end-to-end preklad reči pre každého, kto je prvý na svete reči preklad API
Dnes sme vydali novú verziu ROZHRANIE API prekladača Microsoft , ktorá pridáva preklad schopností prevodu reči na reč (a reči na text) do existujúceho rozhrania API na preklad textu. Je poháňaný najmodernejších technológií umelej inteligencie spoločnosti Microsoft, táto schopnosť bola k dispozícii miliónom používateľov Skype viac ako rok, a na iOS A Android používateľov aplikácií Microsoft Translator od neskorej 2015. Teraz, podniky budú môcť pridať tieto schopnosti reči prekladu do svojich aplikácií alebo služieb a ponúkajú viac prirodzené a efektívne užívateľské skúsenosti pre svojich zákazníkov a zamestnancov.
Preklad reči je k dispozícii pre osem jazykov – arabčina, Čínsky mandarín, angličtina, francúzština, nemčina, taliančina, portugalčina a španielčina. Preklad do textu je k dispozícii vo všetkých Microsoft Translator 50 + podporovaných jazykov. Preklad do hovoreného zvuku je k dispozícii v 18 podporovaných jazykoch.
Táto nová verzia Microsoft Translator je prvý end-to-end reči preklad riešenie optimalizované pre real-život konverzácie (vs jednoduchý človek na stroji príkazy) sú k dispozícii na trhu. Predtým, než dnes, reči preklad riešenia potrebné dláždené spoločne z niekoľkých rôznych API (rozpoznávanie reči, preklad a syntézu reči), neboli optimalizované pre konverzačné reči alebo navrhnuté pre spoluprácu medzi sebou navzájom. Teraz, koncoví používatelia a podniky môžu odstrániť jazykové bariéry s integráciou prekladu reči do svojich známych aplikácií a služieb.
Ako môže moja firma používať technológiu prekladu reči?
Preklad reči možno použiť v rôznych scenároch osoby na osobu, skupinu alebo človeka-stroj. Scenáre medzi osobami môžu zahŕňať jednosmerný preklad, ako je osobný preklad, titulkovanie alebo diaľkové alebo osobné viacjazyčné komunikácie podobné tým, čo sa v súčasnosti nachádza v programe Skype Translator alebo v aplikáciách Microsoft Translator pre iOS a Android. Skupinové scenáre môžu zahŕňať prezentácie v reálnom čase, ako sú napríklad poznámky k udalostným poznámkam, webové vysielania a univerzitné triedy, alebo stretnutia, ako napríklad schôdze osôb alebo online herné miestnosti. Scenáre medzi človekom a strojom môžu zahŕňať scenáre obchodnej inteligencie (napríklad analýzy alebo Denníky hovorov zákazníkov) alebo interakcie AI.
Sme ešte len začína poškriabať povrch scenárov, kde táto technológia pomôže, a ako to je strojové učenie založené, jeho kvalita, a preto uplatniteľnosť zlepší s časom, ako viac ľudí a spoločností, ktoré používajú.
Niekoľko partnerských spoločností otestovala rozhranie API a začlenili ho do svojich vlastných aplikácií:
- Teľa 2 Švédsko, popredný mobilný operátor s viac ako 15 000 000 predplatiteľov vo viac ako 15 krajinách, integrovaný prekladateľ do ich PBX na podporu Real-time telefonické hovory preklady (žiadna aplikácia nutná!) na svojej mobilnej sieti.
- Lionbridge (Boston, MA), poskytovateľ jazykových služieb a Gold Level Translator partner, vyvinul integrovaný video titulkovanie riešenie.
- V meste ProDeaf, predajca aplikácií špecializujúca sa na vývoj technológií na podporu hard-of-sluchu a nepočujúcich komunít, integrované nové API do ich znakový jazyk avatar App umožniť multi-lingválnu podporu reči podpísať scenáre.
Ako funguje preklad reči?
Preklad reči na reč je veľmi zložitá výzva. Využíva najnovšie technológie AI, ako napríklad hlboké neurónové siete na rozpoznávanie reči a preklad textu. Neexistuje žiadne iné plne-integrované riešenie reči preklad k dispozícii na súčasnom trhu a prináša platformu, ktorá by podporila Real-Life reči prekladu scenáre potrebné ísť nad rámec jednoducho šitie dohromady existujúce rozpoznávanie reči a technológie textového prekladu. Existujú štyri etapy reči prekladu, aby mohli dodať túto skúsenosť:
- Automatické rozpoznávanie reči (ASR) — Hlboké neurónové siete vyškolení na tisíce hodín audio analyzuje prichádzajúce reči. Tento model je vyškolený na človeka-na-ľudskej interakcie skôr ako človek-na-stroj príkazy, produkovať rozpoznávanie reči, ktorý je optimalizovaný pre bežné konverzácie.
- PlatíText Inovácia programu Microsoft Research, TrueText má doslovný text a transformuje ho, aby užšie odrážal používateľský zámer. To dosahuje tým, že odstráni reči disflutory, ako je "UM" s a "Ah" s, rovnako ako koktat a opakovanie. Text je tiež čitateľný a prekladateľný pridaním vety prestávky, správne interpunkcia, a kapitalizácie. (pozri obrázok nižšie)
- Preklad Text je preložený do niektorého z 50 + jazykov podporovaných Microsoft Translator. Osem reči jazyky boli ďalej optimalizované pre rozhovory školenia na milióny slov konverzačné dáta pomocou hlboké neurónové siete poháňané jazykové modely.
- Text na reč – Ak je cieľovým jazykom jeden z osemnástich jazykov podporovaných reči, text sa skonvertuje na hlasový výstup pomocou syntézy reči. Táto fáza sa vynechá v scenároch prekladu reči na text, ako je napríklad titulkovanie videa.
Ako začať?
Je ľahké začať s novým Microsoft Translator Speech API. Bezplatná 10-hodinová skúšobná verzia je k dispozícii na aka.ms/TranslatorADMSpeech. Môžete testovať nastavenie a implementáciu vo virtuálnom prostredí, ako aj čítať dokumentáciu API na našej novej Swagger stránku. Môžete tiež nájsť príklady aplikácií a ďalších užitočných informácií o Github.
Samozrejme, ak máte otázky, problémy, alebo spätnú väzbu, radi by sme to počuli! Môžete nám dať vedieť o našich Spätná väzba a diskusné fórum.
Dozvedieť Sa Viac