Trascrizione, traduzione e sintesi vocali personalizzabili ora disponibili nel servizio di Unified Speech
Integrare il discorso nelle tue applicazioni, flussi di lavoro e siti Web utilizzando il servizio Unified Speech, ha annunciato questa settimana a Microsoft Build. Speech combina le funzionalità del traduttore esistente Speech API, Bing Speech API e servizio vocale personalizzato (anteprima) in un servizio unificato e completamente personalizzabile.
È ora possibile utilizzare il discorso per il testo, la traduzione vocale e il testo ai servizi vocali con la stessa sottoscrizione. Tutti e tre i servizi possono essere personalizzati utilizzando l'anteprima del nuovo discorso personalizzato, traduttore e funzioni vocali, ha annunciato anche questa settimana a//Build:
- Discorso al testo (trascrizione di discorso)-convertendo l'audio parlato al testo con i modelli di difetto o su ordine su misura a vocabolario specifico o agli stili parlanti degli utenti (adattamento di modello di linguaggio), o per abbinare più meglio l'ambiente previsto, come con priorità bassa Noise (personalizzazione del modello acustico). La tecnologia speech to text consente una vasta gamma di casi di utilizzo come comandi vocali, trascrizioni in tempo reale e analisi dei log dei Call Center.
- Text to Speech (sintesi vocale)-portando voce a qualsiasi applicazione convertendo testo in audio in tempo quasi reale con la scelta di oltre 75 voci predefinite, o con i nuovi modelli di voce personalizzata, la creazione di una voce unica e riconoscibile marca sintonizzati per le proprie registrazioni.
- Traduzione vocale – fornendo funzionalità di traduzione vocale in tempo reale con modelli basati su tecnologie NMT (Neural Machine Translation). È ora possibile personalizzare tre elementi della pipeline di traduzione vocale: riconoscimento vocale, sintesi vocale e traduzione automatica.
Traduzioni neurali con la versione più recente del traduttore testo API (versione 3), può anche utilizzare i sistemi personalizzati creati utilizzando la nuova funzionalità personalizzata Translator.
Il servizio Unified Speech è attualmente offerto come anteprima. Per la traduzione vocale che richiede un servizio nella disponibilità generale, gli sviluppatori devono continuare a utilizzare l'API di Microsoft Translator Speech. Si prega di seguire il traduttore Microsoft Blog e Twitter pagina per continuare, fino ad oggi annunci servizio Microsoft Translator.
Ulteriori informazioni sul Servizi cognitivi Blog.