微軟翻譯博客

可自訂的語音轉錄、翻譯和合成現在在統一語音服務中可用

本周在 Microsoft 構建.語音將現有翻譯器語音 api、必應語音 api 和自訂語音服務 (預覽) 的功能結合到統一且完全可自訂的服務中。

現在, 您可以使用具有相同訂閱的文本、語音翻譯和文本到語音服務。這三個服務都可以使用新的自訂語音、翻譯和語音功能, 也宣佈本周在/建設:

語音到文本 (語音轉錄) –將語音音訊轉換為文本, 並根據使用者的特定詞彙或口語風格定制預設或自訂模型 (語言模型自訂), 或更好地匹配預期的環境, 如與背景雜訊 (聲學模型定制)。語音到文本技術支援廣泛的用例, 如語音命令、即時轉錄和話務中心日誌分析。
文本到語音 (語音合成) –通過選擇超過75個預設語音或使用新的自訂語音模型, 將文本轉換為音訊, 將語音帶到任何應用程式, 從而創建一個獨特且可識別的品牌語音, 以調整到您自己的錄音。
語音翻譯–通過基於神經機器翻譯 (nmt) 技術的模型提供即時語音翻譯功能。語音翻譯管道的三個元素現在可以自訂: 語音辨識、文本到語音和機器翻譯。

神經翻譯與最新版本的翻譯文本 api (版本 3), 還可以使用使用新的翻譯自訂功能構建的自訂系統。

統一語音服務目前作為預覽提供。對於需要在 "常規可用性" 中提供服務的語音翻譯, 開發人員應繼續使用 microsoft 翻譯語音 api。請關注微軟翻譯博客和推特頁面, 以繼續, 最新的微軟翻譯服務公告。

瞭解更多資訊認知服務博客.