Transcription de la parole personnalisable, traduction et synthèse maintenant disponible dans le service vocal unifié
Intégrez la parole dans vos applications, workflows et sites Web en utilisant le service vocal unifié, annoncé cette semaine à Microsoft Build. Speech combine les fonctionnalités de l'API de la parole Translator existante, l'API de la parole Bing et le service vocal personnalisé (Preview) en un service unifié et entièrement personnalisable.
Vous pouvez maintenant utiliser la parole pour le texte, la traduction vocale et le texte pour les services vocaux avec le même abonnement. Les trois services peuvent être personnalisés à l'aide de l'aperçu de la nouvelles fonctions vocales, traducteurs et voix personnalisées, a également annoncé cette semaine à//Build:
- Discours au texte (transcription vocale) – conversion de l'audio parlée en texte avec des modèles par défaut ou personnalisés adaptés à un vocabulaire ou à des styles parlants spécifiques des utilisateurs (personnalisation du modèle de langue), ou pour mieux correspondre à l'environnement attendu, par exemple avec l'arrière-plan bruit (personnalisation du modèle acoustique). La technologie de la parole en texte permet une large gamme de cas d'utilisation comme les commandes vocales, les transcriptions en temps réel et l'analyse du journal des centres d'appels.
- Texte à la parole (synthèse vocale)-apportant la voix à n'importe quelle application en convertissant le texte en audio en temps quasi réel avec le choix de plus de 75 voix par défaut, ou avec les nouveaux modèles vocaux personnalisés, la création d'une voix de marque unique et reconnaissable à l'écoute de vos propres enregistrements.
- Traduction vocale – fournir des capacités de traduction vocale en temps réel avec des modèles basés sur les technologies de traduction de la machine neurale (NMT). Trois éléments du pipeline de traduction vocale peuvent désormais être personnalisés: reconnaissance vocale, texte à la parole et traduction automatique.
Traduction neurale avec la version la plus récente de l'API de texte Translator (version 3), peut également utiliser des systèmes personnalisés construits à l'aide de la nouvelle fonctionnalité Custom translator.
Le service vocal unifié est actuellement offert en tant qu'aperçu. Pour la traduction vocale nécessitant un service en disponibilité générale, les développeurs doivent continuer à utiliser l'API vocale de Microsoft Translator. Veuillez suivre le traducteur Microsoft Blog Et Twitter page pour continuer, mise à jour des annonces de service Microsoft Translator.
En savoir plus sur le Services cognitifs blog.