Gå til hovedindholdet
Oversætter
Denne side er automatisk oversat af Microsoft Translator maskinoversættelsestjeneste. Lær mere

Microsoft Translator blog

Microsoft Translator bringer end-to-end-tale oversættelse til alle med verdens første tale oversættelses-API

I dag udgav vi en ny version af Microsoft Translator-API , der føjer oversættelsesfunktioner i realtid til tale-til-tale (og tale til tekst) til den eksisterende tekst oversættelses-API. Drevet af Microsofts State-of-the-art kunstig intelligens teknologier, har denne kapacitet været tilgængelig for millioner af brugere af Skype i over et år, og for at iOS Og Android brugere af Microsoft Translator-apps siden slutningen af 2015. Nu vil virksomheder være i stand til at tilføje disse tale oversættelsesfunktioner til deres applikationer eller tjenester og tilbyde mere naturlige og effektive brugeroplevelser til deres kunder og medarbejdere.

Tale oversættelse er tilgængelig for otte sprog – arabisk, Kinesisk mandarin, engelsk, fransk, tysk, italiensk, portugisisk og spansk. Oversættelse til tekst er tilgængelig i alle Microsoft Translator 50 + understøttede sprog. Oversættelse til talt lyd er tilgængelig på 18 understøttede sprog.

Denne nye version af Microsoft Translator er den første end-to-end tale oversættelses løsning, der er optimeret til virkelige samtaler (vs. simple menneskelige til maskin kommandoer), der er tilgængelige på markedet. Før i dag var det nødvendigt at samle tale oversættelsesløsninger fra en række forskellige API'er (talegenkendelse, oversættelse og talesyntese), som ikke var optimeret til konversation eller designet til at arbejde sammen. Nu kan både slutbrugere og virksomheder fjerne sprogbarrierer med integrationen af tale oversættelse i deres velkendte apps og tjenester.

 

Hvordan kan min virksomhed bruge tale oversættelsesteknologi?

Tale oversættelse kan bruges i en række forskellige person-til-person-, gruppe-eller menneske-til-maskine-scenarier. Person-til-person-scenarier kan omfatte envejs oversættelse, såsom personlig oversættelse, tekstning, eller fjern eller personligt flersproget kommunikation svarende til hvad der i øjeblikket findes i Skype Translator eller Microsoft Translator apps til iOS og Android. Gruppescenarier kan omfatte præsentationer i realtid såsom hændelses-keynotes, webcasts og universitets klasser eller sammenkomster, såsom i-person møder eller online gaming chatrooms. Menneske-til-maskine-scenarier kan omfatte Business Intelligence-scenarier (f. eks. analyse-eller kunde opkaldslogfiler) eller AI-interaktioner.

Vi er lige begyndt at ridse overfladen af de scenarier, hvor denne teknologi vil hjælpe, og da det er maskinlæring baseret, dens kvalitet og derfor anvendelighed vil forbedre sig med tiden som flere mennesker og virksomheder bruger det.

Flere partnervirksomheder har testet API'EN og integreret den i deres egne Apps:

  • Mere om Tele 2 af Sverige, en førende mobiloperatør med mere end 15.000.000 abonnenter i over 15 lande, integreret Translator i deres PBX til at understøtte real-time telefonopkald oversættelser (ingen app behov!) på deres mobilnetværk.
  • Lionbridge (Boston, MA), en sprogtjeneste udbyder og Gold level Translator partner, udviklet en integreret video tekstning løsning.
  • Prodøv, en applikations leverandør med speciale i udvikling af teknologier til støtte for hørehæmmede og døve samfund, integreret den nye API i deres tegnsprog avatar app til at muliggøre flersproget støtte af tale til at underskrive scenarier.

 

Hvordan fungerer tale Oversættelse?

Tale-til-tale oversættelse er en meget kompleks udfordring. Den bruger de nyeste AI-teknologier, såsom dybe neurale netværk til talegenkendelse og tekst Oversættelse. Der er ingen anden fuldt integreret tale oversættelses løsning tilgængelig på markedet i dag og levere en platform, der ville støtte Real-Life tale oversættelses scenarier kræves går ud over blot at sy sammen eksisterende talegenkendelse og tekst oversættelses teknologier. Der er fire stadier til tale oversættelse for at kunne levere denne oplevelse:

  1. Automatisk talegenkendelse (ASR) — En dyb neurale netværk trænet på tusindvis af timers lyd analyserer indgående tale. Denne model er uddannet på menneske-til-menneske-interaktioner snarere end menneske-til-maskine kommandoer, der producerer talegenkendelse, der er optimeret til normale samtaler.
  2. True En Microsoft Research-innovation, TrueText tager den bogstavelige tekst og forvandler den til mere nøjagtigt at afspejle brugerens hensigt. Det opnår dette ved at fjerne tale disfluencer, såsom "UM" s og "Ah" s, samt hakker og gentagelser. Teksten er også gjort mere læsbar og kan oversættes ved at tilføje sætning pauser, korrekt tegnsætning, og kapitalisering. (se billedet nedenfor)
  3. Oversættelse Teksten oversættes til et af de 50 + sprog, der understøttes af Microsoft Translator. De otte talesprog er blevet yderligere optimeret til samtaler gennem uddannelse på millioner af ord af konversation data ved hjælp af dybe neurale netværk drevet sprogmodeller.
  4. Tekst til tale – Hvis målsproget er et af de atten talesprog, der understøttes, konverteres teksten til Taleoutput ved hjælp af talesyntese. Denne fase er udeladt i tale-til-tekst Oversættelse scenarier såsom video tekstning.

Hvordan kommer jeg I gang?

Det er nemt at komme i gang med den nye Microsoft Translator Speech API. En gratis 10-timers prøveversion er tilgængelig på aka.ms/TranslatorADMSpeech. Du kan afprøve opsætning og implementering i et virtuelt miljø samt læse API-dokumentationen på vores nye Swagger side. Du kan også finde eksempler på apps og andre nyttige oplysninger om Github.

Selvfølgelig, hvis du har spørgsmål, problemer eller feedback, vil vi elske at høre det! Du kan give os besked på vores feedback og support forum.

Lær mere