Microsoft 翻譯人員在其產品中加速使用神經網路
整整一年前,微軟翻譯 向所有人提供新的人工智慧支援技術:神經機器翻譯 (NMT) .自那時以來,該團隊一直在努力擴大NMT的使用,以改善 Microsoft 翻譯文本和語音 API 以及 Microsoft 翻譯人員支援的所有產品的翻譯。
今天,Microsoft 翻譯團隊宣佈 NMT 技術的若干發展,無論您如何使用高級 AI 翻譯,您都可以更容易訪問:
- 現在,在 API 和應用程式中,NMT 都提供了 10 種新語言
- 所有針對中文和印度文的 API 流量現在都由 NMT 提供支援,開發人員無需執行任何操作來使用它
- 新的"混合"翻譯都可用於 API 和應用程式使用者,為 NMT 上尚未提供的語言帶來神經翻譯的好處
- 語音翻譯現在通過 LSTM 技術端到端地供電,語音 API 中語音辨識 LSTM 系統發佈
- NMT 現在也作為內部服務提供
NMT 技術改變了機器翻譯,與現有的行業標準統計機器翻譯 (SMT) 技術一起,在翻譯品質方面取得了重大進步。NMT 在翻譯完整句子之前更好地捕獲了完整的句子上下文,提供了更高品質的翻譯和更人性化的輸出。瞭解有關 NMT 如何工作 在微軟翻譯網站上, 觀看下面的視頻, 看看 nmt 是如何集成到微軟翻譯的語音翻譯。
今天,您可以在 Bing 的翻譯, 該 微軟翻譯應用程式, 邊緣, 該 翻譯器 powerpoint 添加,當然還有微軟翻譯 文本 和 演講 Api。
介紹 10 種新的 NMT 支援語言
微軟翻譯在其NMT系統清單中增加了10種新語言——現在有21種語言,並且還在增長!NMT 現在為以下語言的翻譯提供功能(以下語言為 大膽).
阿拉伯文
保加利亞文 中文 捷克文 丹麥文 荷蘭文 英語 |
法語
德語 印度文 義大利文 日語 朝鮮語 挪威語 |
波蘭文
葡萄牙文 羅馬尼亞 俄語 西班牙文 瑞典文 圖爾基斯H |
100%的中文和印度文翻譯遷移到NMT
微軟正在使NTM更容易提供給開發人員。具體來說,所有中文和印度文翻譯和英語現在都使用我們新的NMT系統預設。 這意味著開發人員無需在其應用中調用"Generalnn"類別才能從這些新系統中受益。對於其他語言,此類別仍是必需的,但在接下來的幾周和幾個月中,其他語言將切換到 100% NMT。
對於希望暫時繼續使用 smt 系統的開發人員, 例如, 如果他們使用 樞紐, 在調用 api 時, 可以使用 "smt" 類別。
"混合"神經/統計翻譯
使用混合翻譯,當您翻譯或從的兩種語言中只有一種是 NMT 支援的時,您仍然會看到翻譯品質的提高。
由於語言之間缺乏可用的培訓資料,而且每個語言對構建和運行專用系統的複雜性呈指數級,機器翻譯系統使用英語作為"透視語言",從一種語言轉換為其他。這意味著,每次您要求機器翻譯系統從中文翻譯成西班牙文時,翻譯系統通常將中文翻譯成英語,然後將英語翻譯成西班牙文。
使用混合翻譯,當兩種語言中至少有一種具有可用的 NMT 系統時,Microsoft 翻譯人員將自動使用 NMT 進行翻譯的該部分。翻譯的這一部分將改進,使整個翻譯更好。查看我們在 Microsoft 支援論壇上的文章,以便 瞭解有關混合翻譯的更多資訊.
端到端 LSTM 神經網路支援語音翻譯,顯著提高語音翻譯品質
語音辨識正在向高級 LSTM 神經網路架構。結合可用語音資料的增加,LSTM 語音辨識提高了品質(按行業標準衡量)單詞錯誤率") 高達 29%,具體取決於語言。這直接影響到機器翻譯的品質,因為語音辨識越準確,因此翻譯的準確程度就越大。
因此,微軟翻譯公司的NMT使用LSTM技術*語音翻譯現在從端到端使用LSTM技術。試用端到端的 LSTM 語音轉換功能,在 翻譯器 powerpoint 添加, 在 http://translate.it 和該 微軟翻譯應用程式,或 翻譯語音 API.
內部神經網路
對於需要其他資料安全性的組織,神經網路轉換現在也可以作為內部部署服務使用組織自己的伺服器而不是 Microsoft Azure 雲服務。瞭解有關 微軟翻譯的本地產品.