Gå til hovedinnhold
Oversetter
Denne siden er automatisk oversatt av Microsoft Translator sin maskinoversettelsestjeneste. få mer informasjon

Microsoft oversetter blogg

Microsoft Translator bringer ende-til-ende-taleoversettelse til alle med verdens første tale Oversettelses API

I dag lanserte vi en ny versjon av Microsoft oversetteren API som legger til oversettelsesfunksjoner i sanntid tale-til-tale (og tale til tekst) i den eksisterende API-en for tekst oversetting. Drevet av Microsofts State-of-the-art kunstig intelligens teknologier, har denne evnen vært tilgjengelig for millioner av brukere av Skype i over et år, og for å iOS Og Android brukere av Microsoft Translator-appene siden slutten av 2015. Nå vil bedrifter kunne legge til disse tale Oversettelses funksjonene til sine programmer eller tjenester og tilby mer naturlige og effektive brukeropplevelser til sine kunder og ansatte.

Taleoversettelse er tilgjengelig for åtte språk – Arabisk, Kinesisk mandarin, engelsk, fransk, tysk, italiensk, portugisisk og spansk. Oversettelse til tekst er tilgjengelig i alle Microsoft Translator ' s 50 + støttede språk. Oversettelse til tale lyd er tilgjengelig på 18 støttede språk.

Denne nye versjonen av Microsoft Translator er den første ende-til-ende-løsningen for taleoversettelse som er optimalisert for samtaler i det virkelige liv (kontra enkelt menneske til maskin kommandoer) som er tilgjengelig på markedet. Før i dag var løsninger for taleoversettelse som måtte være brosteinsbelagte sammen fra en rekke forskjellige APIer (talegjenkjenning, oversettelse og tale syntese), ikke optimalisert for conversational tale eller utformet for å fungere med hverandre. Nå kan sluttbrukere og bedrifter både fjerne språkbarrierer med integreringen av taleoversettelse i sine velkjente apper og tjenester.

 

Hvordan kan bedriften min bruke tale Oversettelses teknologi?

Taleoversettelse kan brukes i en rekke scenarioer for person-til-person, gruppe eller menneske-til-maskin. Person-til-person-scenarier kan inkludere enveis oversettelse, for eksempel personlig oversettelse, teksting eller eksterne eller personlige flerspråklige kommunikasjoner som ligner på det som i øyeblikket finnes i Skype Translator eller Microsoft Translator-appene for iOS og Android. Gruppe scenarioer kan inkludere sann tids presentasjoner som hendelses Keynotes, webcast og universitets klasser, eller samlinger som i-person møter eller online spill chatrooms. Menneske-til-maskin-scenarier kan inkludere forretningsintelligens scenarioer (for eksempel analyse-eller kunde samtalelogger) eller samhandlinger med AI.

Vi er bare å begynne å klø overflaten av scenariene der denne teknologien vil hjelpe, og som det er maskinlæring basert, kvaliteten og derfor anvendelse vil forbedre med tiden som flere mennesker og bedrifter bruker det.

Flere partnerselskaper har testet API-et og integrert i sine egne apper:

  • Tele 2 av Sverige, en ledende mobiloperatør med mer enn 15 000 000 abonnenter i over 15 land, integrert Translator i sin PBX for å støtte sanntids telefonsamtaler oversettelser (ingen app nødvendig!) på deres mobilnettverk.
  • LionBridge (Boston, MA), en språk tjenesteleverandør og Gold Level Translator partner, utviklet en integrert video teksting løsning.
  • ProDeaf, et programleverandør som spesialiserer seg på å utvikle teknologier for å støtte hard-of-hørsel og døve samfunn, integrert den nye API i deres tegnspråk avatar app for å aktivere flerspråklig støtte tale å signere scenarier.

 

Hvordan fungerer taleoversettelse?

Tale-til-tale-oversettelsen er en svært kompleks utfordring. Den bruker den nyeste AI teknologi, for eksempel dype nevrale nettverk for talegjenkjenning og tekst oversettelse. Det finnes ingen annen fullstendig integrert tale Oversettelses løsning som er tilgjengelig på markedet i dag, og som leverer en plattform som støtter scenarioer for taleoversettelse i det virkelige liv, som kreves for å gå utover bare å sy sammen eksisterende talegjenkjenning og tekst oversettelse teknologier. Det er fire stadier til taleoversettelse for å kunne levere denne erfaringen:

  1. Automatisk Talegjenkjenning (ASR) – Et dypt nettverk trent på tusenvis av timer med lyd analyserer innkommende tale. Denne modellen er opplært på menneske-til-menneske interaksjoner i stedet for menneske-til-maskin-kommandoer, som produserer talegjenkjenning som er optimalisert for vanlige samtaler.
  2. Sann En Microsoft forskning nyhet, sann tar det Ordrett tekst og forvandler den å nøyere reflektere bruker hensikt. Det oppnår dette ved å fjerne tale disfluencies, for eksempel "UM" s og "ah" s, samt stamming og repetisjoner. Teksten er også gjort mer lesbar og oversettbare ved å legge setning pauser, riktig tegnsetting og kapitalisering. (se bildet nedenfor)
  3. Oversettelse Teksten er oversatt til noen av de 50 + språkene som støttes av Microsoft Translator. De åtte tale språkene har blitt ytterligere optimalisert for samtaler ved å trene på millioner av ord av conversational data ved hjelp av dype nevrale nettverk drevet språk modeller.
  4. Tekst-til-tale — Hvis målspråket er et av de atten tale språkene som støttes, blir teksten konvertert til tale-utdata ved hjelp av tale syntese. Dette stadiet utelates i tale-til-tekst Oversettelses scenarioer, for eksempel video teksting.

Hvordan kommer jeg I gang?

Det er enkelt å komme i gang med den nye Microsoft Translator Speech API-en. En gratis 10-timers prøveversjon er tilgjengelig på aka.ms/TranslatorADMSpeech. Du kan teste ut oppsett og implementering i et virtuelt miljø, samt lese API-dokumentasjonen på vår nye Skryte side. Du kan også finne eksempel apper og annen nyttig informasjon om Github.

Selvfølgelig, hvis du har spørsmål, problemer eller tilbakemeldinger, vil vi gjerne høre det! Du kan gi oss beskjed på vår tilbakemeldinger og støtte Forum.

få mer informasjon