Microsoft 翻譯器加速在其產品中使用神經網路
整整一年前,微軟翻譯器 讓每個人都能使用新的 AI 驅動技術:神經機器翻譯 (NMT) .自此之後,該團隊一直努力擴大 NMT 的使用範圍,以改善 Microsoft Translator 文字和語音 API 以及所有 Microsoft Translator 支援產品中的翻譯。
今天,Microsoft Translator 團隊宣佈 NMT 技術的幾項發展,讓進階的 AI 翻譯更容易使用,無論您如何使用:
- 在 API 和應用程式中,NMT 現在可使用 10 種新語言
- 所有中文和印地語的 API 流量現在都由 NMT 提供,開發人員不需要做任何動作即可使用。
- 新的「混合」翻譯功能可供 API 和應用程式使用者使用,可將神經翻譯的優點帶到 NMT 尚未提供的語言上
- 隨著語音 API 中的語音識別 LSTM 系統的釋出,語音翻譯現在可以使用 LSTM 技術進行端到端的驅動。
- NMT 現在也可提供現場服務
NMT 技術改變了機器翻譯,與現有的業界標準統計機器翻譯 (SMT) 技術相比,在翻譯品質上有了重大進步。NMT 可以在翻譯完整句子之前更好地捕捉上下文,提供更高質量的翻譯和更人性化的輸出。進一步瞭解 NMT 如何運作 上的 Microsoft Translator 網站,並觀看以下視訊,瞭解 NMT 如何整合至 Microsoft Translator 的語音翻譯。
您今天就可以在以下網站試用全新的 NMT Powered 翻譯功能 Bing 翻譯器,......。 Microsoft 翻譯器應用程式, 邊緣,......。 翻譯員 PowerPoint 附加元件當然還有 Microsoft 翻譯器 正文 和 演講 APIs.
介紹 10 種新的 NMT Powered 語言
Microsoft Translator 在其 NMT 系統清單中新增 10 種語言 - 現在已有 21 種語言,而且還在增加中!NMT 現在提供下列語言的翻譯功能 (新語言請見下表) 果敢).
阿拉伯語
保加利亞語 中文 捷克語 丹麥語 荷蘭語 英語 |
法語
德國 北印度語 義大利語 日本語 韓語 挪威語 |
波蘭語
葡萄牙語 羅馬尼亞語 俄語 西班牙語 瑞典語 土耳其語h |
100% 的中文和印地語翻譯移到 NMT
Microsoft 正讓開發人員更容易使用 NTM。具體來說,所有中文和印地文與英文的互譯現在都預設使用我們新的 NMT 系統。 這表示開發人員不需要在其應用程式中呼叫「generalnn」類別,即可受惠於這些新系統。對於其他語言,仍然需要使用此類別,但在未來幾週或幾個月內,其他語言將轉換為 100% NMT。
對於想要暫時繼續使用 SMT 系統的開發人員,例如,如果他們已經使用 集線器, 類別 "SMT" 可以在呼叫 API 時使用。
"混合式」神經/統計翻譯
使用混合翻譯,當您翻譯的兩種語言中只有一種是由 NMT 驅動時,您仍然可以看到翻譯品質的提升。
由於不同語言之間可用的訓練資料稀少,而且為每對語言建立和運行專用系統的複雜性呈指數級遞增,因此機器翻譯系統使用英文作為從一種語言翻譯到另一種語言的「樞紐語言」。這意味著每次您要求機器翻譯系統從例如中文翻譯成西班牙文時,翻譯系統通常會將中文翻譯成英文,然後再將英文翻譯成西班牙文。
在混合翻譯中,當兩種語言中至少有一種語言有可用的 NMT 系統時,Microsoft Translator 將自動在該部分翻譯中使用 NMT。這部分的翻譯會有所改善,使整個翻譯更好。檢視我們在 Microsoft 支援論壇上的文章,以 進一步瞭解混合翻譯.
端對端 LSTM 神經網路驅動語音翻譯,大幅改善語音翻譯品質
語音辨識正邁向進階 LSTM 神經網路架構。結合可用語音資料的增加,LSTM 語音識別改善了品質(以業界標準" "衡量)。字錯誤率")高達 29%,視語言而定。這對於機器翻譯的品質有直接的影響,因為語音辨識越準確,所得到的翻譯結果也就越準確。
Microsoft Translator 的 NMT 使用 LSTM 技術,因此語音翻譯現在從頭到尾都使用 LSTM 技術。使用 Microsoft Translator 的即時功能試用端對端 LSTM 語音翻譯功能。 翻譯員 PowerPoint 附加元件,於 http://translate.it 和 Microsoft 翻譯器應用程式或在 翻譯器語音 API.
場所神經網路
對於需要額外資料安全性的組織而言,神經網路轉譯現在也可作為現場服務提供,使用組織自己的伺服器而非 Microsoft Azure 雲端服務。進一步瞭解 Microsoft 翻譯器的處所產品.