韓國人成為微軟翻譯的第11種神經網路翻譯語言
去年 微軟宣佈 其發佈 基於神經網路的翻譯系統 10種語言: 阿拉伯文、中文、英語、法語、德語、義大利文、日語、葡萄牙文、俄語和西班牙文。如今, 韓文被列入名單。
神經網路翻譯使用句子的完整上下文來翻譯單詞, 不僅基於它前後的幾個單詞, 而且基於完整的句子, 產生更流暢、更人性化的翻譯。這項新的 ai 驅動的技術提供了自10年前統計機器翻譯成為行業標準以來, 機器翻譯品質的最顯著改進。
由於這些品質和流暢性的提高, 翻譯是有史以來最接近人類產生的翻譯的。
它是如何工作的
在較高的層次上, 神經網路翻譯分兩個階段進行:
- 第一階段根據這個詞的上下文 (及其可能的翻譯) 在完整的句子中類比需要翻譯的單詞, 不管句子是5個單詞還是20個單詞。
- 第二階段然後將這個單詞模型 (不是單詞本身, 而是神經網路建立的模型) 在句子的上下文中翻譯成另一種語言。
神經網路翻譯使用單詞翻譯模型基於它從兩種語言知道關於詞和句子上下文尋找最適當的詞並且最適當的位置為這個被翻譯的詞在句子。
考慮基於神經網路的翻譯的一個方法是想一個流利的英語和法語消費者, 在一句話中讀出 "狗" 這個詞: "狗很快樂"。這將在他或她的大腦中創造狗的形象。這張圖片將與法語中的 "樂漸" 聯繫在一起。神經網路本質上知道 "chien" 一詞在法語中是男性的 ("le" 而不是 "la")。但是, 如果這句話是 "狗剛剛產下6只小狗", 它將想像同一隻狗與小狗護理, 然後自動使用 "la chienne" (女性形式的 "le chienne") 翻譯句子。
下面是下面句子中使用的這項新技術的優點的一個示例: (我們嘗試比較網站時隨機提出的技術之一: http://translate.ai)
M277dw에 종이 문서를 올려놓고, 스마트폰으로 스캔 명령을 내린 뒤 해당 파일을 스마트폰에 즉시 저장할 수 있다.
傳統的統計機器翻譯將提供以下翻譯:
"m277dw, 指向文檔, 檔掃描命令智慧手機智能手機可以立即存儲的紙張。
神經網路的翻譯, 相比之下, 生成這個清晰和流暢的句子:
"您可以將紙質文檔放在 m277dw 上, 然後在掃描命令後立即將檔保存到智慧手機。
神經網路翻譯系統可供您通過許多進入點使用:
- 瀏覽器: 我們希望您能對新的神經網路韓語翻譯系統與傳統統計系統的回饋!訪問我們的嘗試和比較網站: http://translate.ai
- 微軟翻譯器線上直播功能: 當使用我們新的個人通用通信功能, 微軟翻譯現場, 神經翻譯也將使用。例如, 如果使用此功能將9種受支援的語音語言中的任意一種的即時演示文稿翻譯成 11個 nn 支援的翻譯系統中的任何一個, 則將使用神經網路技術提供字幕: http://translate.it
- skype 中的即時消息: 使用 skype 桌面和 skype windows 10 預覽中的 skype 翻譯功能翻譯即時消息 (來自和轉換為這11種語言中的任何一種)。
此外, 開發人員可以輕鬆地集成 microsoft 翻譯神經網路系統, 方法是使用 類別 "一般" 在他們的 api 調用中。使用我們的神經網路模型與現有的統計模型相比, 沒有額外的成本, 所以不要猶豫使用它們!
對於語音翻譯專案, 微軟翻譯語音 API 已經使用神經網路翻譯從我們的任何 9種語音翻譯語言 所有11種神經網路驅動的語言。
瞭解更多資訊:
神經網路的工作原理是什麼?
微軟翻譯現場功能: 個人通用翻譯
微軟翻譯應用程式
微軟人工智慧