跳至主要內容
翻譯員

微軟翻譯器部落格

韓文成為 Microsoft Translator 的第 11 種神經網路翻譯語言

漢城之夜

 

去年 微軟宣布 發布其 基於神經網路的翻譯系統 適用於 10 種語言:阿拉伯文、中文、英文、法文、德文、義大利文、日文、葡萄牙文、俄文和西班牙文。今天,韓語也被添加到列表中。

神經網路翻譯使用句子的完整上下文來翻譯字詞,不僅僅根據其前後的幾個字,而是根據完整的句子,產生更流暢、更人性化的翻譯。自 10 年前統計機器翻譯成為業界標準以來,這項由 AI 驅動的新技術為機器翻譯品質帶來了最顯著的改善。

由於翻譯品質與流暢度的提升,翻譯已經達到最接近人工產生的程度。

 

如何運作

如何運作

 

從高層次來看,神經網路翻譯分為兩個階段:

  1. 第一階段會依據完整句子中該字詞 (及其可能的翻譯) 的上下文,為需要翻譯的字詞建立模型,不論句子長度是 5 個字還是 20 個字。
  2. 第二階段會將此單字模型 (不是單字本身,而是神經網路所建立的模型) 在句子的上下文中翻譯成另一種語言。

神經網路翻譯使用字詞翻譯的模型,根據它從兩種語言所知道的字詞和句子上下文,找出最適當的字詞,以及這個翻譯字詞在句子中最合適的位置。

思考基於神經網路的翻譯的一種方法是,想一想流利的英語和法語使用者會在句子中讀出 「狗 」這個字:「狗很開心」。這會在他或她的大腦中產生狗的形象。這個影像會與法文中的「le chien」聯繫起來。神經網路本質上知道「chien」一詞在法文中是男性化的 ("le 「而非 」la")。但是,如果句子是「這隻狗剛生了六隻小狗」,它就會想像同一隻小狗正在哺乳,然後在翻譯句子時自動使用「la chienne」(「le chien」的雌性形式)。

 

以下是一個例子,說明這項新技術在以下句子中使用的好處:(在我們的嘗試與比較網站上隨機提出的其中一項: http://translate.ai)

M277dw에 종이 문서를 올려놓고, 스마트폰으로 스캔 명령을 내린 뒤 해당 파일을 스마트폰에 즉시 저장할 수 있다.

傳統的統計機器翻譯會提供這種翻譯:

「M277dw,指向文件,紙張脫落的文件掃描命令智能手機智能手機可以立即存儲」。

相比之下,神經網路翻譯能產生這個清晰流暢的句子:

「您可以將紙張文件放置在 M277DW 上,然後在掃描指令執行後立即將檔案儲存至智慧型手機」。

 

神經網路翻譯系統可透過許多入口點供您使用:

  • 瀏覽器:我們希望收到您對新的神經網路韓語翻譯系統與傳統統計系統之間的意見回饋!請造訪我們的試用與比較網站: http://translate.ai
  • Microsoft 翻譯器即時功能:當使用我們新的個人通用溝通功能 Microsoft Translator live 時,也會使用神經翻譯。例如,如果您使用此功能將 9 種支援的語音語言中的任何一種現場簡報翻譯為 11 種 NN 驅動的翻譯系統中的任何一種,則字幕將使用神經網路技術傳送: http://translate.it 
  • Skype 中的即時訊息:使用 Skype 桌面版和 Windows 10 版 Skype 預覽版中的 Skype 翻譯器功能翻譯即時訊息(可翻譯為這 11 種語言中的任何一種)。

此外,開發人員可以透過使用 類別 "generalnn" 在他們的 API 呼叫中。與現有的統計模型相比,使用我們的神經網路模型並不需要額外的成本,所以請不要猶豫使用它們!

對於語音翻譯專案 微軟翻譯器語音 API 已經使用神經網路翻譯,從我們的任何 9 種語言翻譯語言 到所有 11 種神經網路驅動的語言。

 

瞭解更多:

神經網路翻譯如何運作?
Microsoft Translator 即時功能:個人通用翻譯器
Microsoft 翻譯器應用程式
微軟 AI