Gå till huvudinnehåll
Översättare
Den här sidan har översatts automatiskt av Microsoft Translator: s maskinöversättningstjänst. Lära sig mer

Microsoft Translator blogg

Microsoft Translator ger punkt till punkt tal översättning till alla med världens första tal översättning API

Idag släppte vi en ny version av Microsoft Translator API som lägger till översättnings funktioner i real tid för tal till tal (och tal till text) till det befintliga API: t för text översättning. Drivs av Microsofts State-of-the-art artificiell intelligens teknik, har denna kapacitet varit tillgänglig för miljon tals användare av Skype i över ett år och för att iOS Och Android användare av Microsoft Translator apps sedan sent 2015. Nu kommer företag att kunna lägga till dessa tal översättnings funktioner till sina applikationer eller tjänster och erbjuda mer naturliga och effektiva användar upplevelser till sina kunder och personal.

Tal översättning är tillgängligt för åtta språk – Arabiska, Kinesiska mandarin, engelska, franska, tyska, italienska, portugisiska och spanska. Översättning till text finns i alla Microsoft Translator: s 50 + språk som stöds. Översättning till talat ljud finns på 18 språk som stöds.

Den här nya versionen av Microsoft Translator är den första punkt till punkt tal översättnings lösning optimerad för verkliga konversationer (kontra enkla människa till maskin kommandon) som finns på marknaden. Innan dagens tal översättnings lösningar behövde vara kullerstensbelagda tillsammans från ett antal olika API: er (tal igenkänning, översättning och tal syntes), var inte optimerade för konversations tal eller utformats för att arbeta med varandra. Nu kan slutanvändare och företag både ta bort språk barriärer och integrera tal översättning i sina välbekanta appar och tjänster.

 

Hur kan mitt företag använda tal översättnings teknik?

Tal översättning kan användas i olika scenarier för person-till-person-, grupp-eller människa-till-dator. Person-till-person-scenarier kan omfatta enkelriktad översättning, till exempel personlig översättning, textning eller flerspråkig flerspråkig kommunikation som liknar vad som för närvarande finns i Skype Translator eller Microsoft Translator-apparna för iOS och Android. Grupp scenarion kan innefatta presentationer i real tid, till exempel händelse-tangentanteckningar, webb sändningar och universitets klasser, eller sammankomster som i-person möten eller chattrum för onlinespel. Scenarier från människa till dator kan omfatta Business Intelligence-scenarier (till exempel analys-eller kund samtals loggar) eller AI-interaktioner.

Vi har precis börjat skrapa ytan av de scenarier där denna teknik kommer att hjälpa och, eftersom det är maskin inlärning baserad, dess kvalitet och därmed tillämplighet kommer att förbättras med tiden som fler människor och företag använder den.

Flera partner företag har testat API och integrerat det i sina egna appar:

  • Tele 2 (på) av Sverige, en ledande mobil operatör med mer än 15 000 000 abonnenter i över 15 länder, integrerad översättare i sin PBX för att stödja real tid telefonsamtal översättningar (ingen app behövs!) på deras mobil nät.
  • Lionbridge (Boston, MA), en språk tjänst leverantör och Gold Level Translator-partner, utvecklade en integrerad video under textning lösning.
  • Prodöv, en applikations leverantör som specialiserat sig på att utveckla teknik för att stödja den hörselskadade och döva samhällen, integrerat den nya API i deras teckenspråk avatar app för att möjliggöra flerspråkig stöd för tal att underteckna scenarier.

 

Hur fungerar tal Översättning?

Tal till tal-översättning är en mycket komplicerad utmaning. Den använder den senaste AI-teknik, såsom djupa neurala nätverk för tal igenkänning och text översättning. Det finns ingen annan helt integrerad tal översättnings lösning som finns på marknaden idag och leverera en plattform som skulle stödja verkliga tal översättnings scenarier krävs går utöver att bara sy ihop befintliga tal igenkänning och text översättnings teknik. Det finns fyra stadier till tal översättning för att kunna leverera denna upplevelse:

  1. Automatisk tal igenkänning (ASR) — Ett djupt neuralt nätverk tränat på tusentals timmar av ljud analyserar inkommande tal. Den här modellen är utbildad på människa till människa interaktioner snarare än människa-till-maskin-kommandon, som producerar tal igenkänning som är optimerad för normala konversationer.
  2. Sanntext En Microsoft Research innovation, TrueText tar bokstavlig text och omvandlar den till mer noggrant återspegla användarnas avsikter. Det uppnår detta genom att ta bort tal disfluenser, såsom "UM" s och "Ah" s, samt hakar och repetitioner. Texten blir också mer läsbar och översättnings bar genom att lägga till menings brytningar, rätt skiljetecken och versaler. (se bilden nedan)
  3. Översättning Texten översätts till något av de 50 + språk som stöds av Microsoft Translator. De åtta tal språken har ytterligare optimerats för samtal genom utbildning på miljon tals ord av konversations data med hjälp av djupa neurala nätverk drivna språk modeller.
  4. Text till tal — Om mål språket är ett av de arton tal språk som stöds, konverteras texten till talutdata med hjälp av tal syntes. Det här steget utelämnas i tal-till-text-översättningsscenarier som video textning.

Hur kommer jag igång?

Det är enkelt att komma igång med det nya tal-API: t för Microsoft Translator. En gratis 10-timmars test period finns tillgänglig på aka.ms/TranslatorADMSpeech. Du kan testa installation och implementering i en virtuell miljö, samt läsa API-dokumentationen på vår nya Swagger-sida. Du kan också hitta exempel på appar och annan användbar information om Github.

Naturligtvis, om du har frågor, frågor eller feedback, vi vill gärna höra det! Du kan låta oss veta på vår feedback och support forum.

Lära sig mer