選擇語言:

Lionbridge 機器翻譯追蹤工具 (Lionbridge Machine Translation Tracker)

鄭重介紹我們的評估工具,協助您挑選最符合需求的機器翻譯引擎

簡介

機器翻譯 (MT) 問世已有多年,但一直到近幾年,它的進展才突飛猛進。隨著企業需要以多種不同語言創作更多內容,他們也更加看好機器翻譯這項技術,以協助他們在日漸全球化的世界觸及更多客群。

想部署機器翻譯的企業,有四種基本策略可以選擇:

公用 MT

使用 Google 或 Bing 這類的翻譯服務。這些服務可供任何人隨時隨地免費使用,但不提供像是自訂術語這類進階功能,同時資料可能也會被用於其他服務。

內部 MT

採用這種作法的企業,必須在他們的 IT 環境中部署機器翻譯伺服器。這麼做雖然安全性高,但所費不貲,部署與管理也非常複雜,而且需要持續不斷地維護。

雲端 MT

使用方式類似公用 MT,不過伺服器是在雲端代管,而且可以建立公司專屬的執行個體,所有與服務分享的資訊都會受到嚴密保護,不會與第三方分享。這類服務能提供自訂術語和其他便利功能,但往往會導致企業必須仰賴特定一家廠商,而且也難以在不同語言組合間得到最佳的機器翻譯品質。

業內最佳 MT

可以管理多個機器翻譯引擎的單一平台,能提供一套集中管理的自訂術語、簡易好用的介面,並可針對不同的語言組合與內容類型選擇最合適的引擎。

無論採取什麼策略,如果沒有適當的資料與經驗,往往就很難挑選出合適的引擎。Lionbridge 在機器翻譯領域耕耘超過 20 年,具有豐富經驗,更在機器翻譯技術方面收集了大量的語言和品質資料,能協助客戶做出最適當的選擇。本網頁將針對最常見的語言組合,提供機器翻譯引擎表現的基本資訊,進而協助企業做出最適合自己內容的選擇。

哪一款機器翻譯 (MT) 引擎最好? 這個答案並沒有那麼簡單。


在市面上許多 MT 系統中做選擇,您一定要知道:有些引擎會更擅長處理特定功能或領域。 如果您的需求並不包含這些功能或領域,那麼就算這些引擎的技術再先進,對您而言,其效能表現可能還是不盡理想。 因此要找到您的最佳選擇,首要之務就是要了解您使用 MT 的理由。

如果您要將 MT 引擎用於一般用途,Google 翻譯或 Bing 翻譯工具會是不錯的合適選擇; 如果是想針對特定語言或領域使用 MT,那麼改為使用 Amazon Translate 或 DeepL 翻譯器 (DeepL Translator) 可能會有更好的成果。

Lionbridge 的機器翻譯追蹤工具每個月都會分析各大引擎的效能表現,協助您根據自己的語言組合找出最適合您的 MT 引擎。 因此下次想知道哪一款 MT 引擎最好時,不妨將問題改成:「那一款 MT 引擎最適合我?」,並參考 Lionbridge 的分析指引做出明智的選擇。

想進一步了解不同類型的機器翻譯技術嗎?請參閱我們的部落格文章:機器翻譯詞彙解釋

Lionbridge 專家評論

2022 年 4 月

Yandex 的 MT 引擎效能數個月以來都沒什麼變化,最近終於有了一些進步,在德文引擎上尤其明顯。

我們透過一項詳盡的分析,發現到 Yandex 引擎在處理含有標點符號字元 (例如問號、驚嘆號、引號和斜線號等) 及度量衡單位的句子上有進步。 這些改進可能是源自於 MT 設定上的細微調整,而非模型上的改善。 然而,我們在追蹤罕見詞彙時也看到了進步,所以也可能是模型的微調或是更多的資料訓練,使得 Yandex 有所改善。

去年此時,也有數個 MT 引擎展現了我們頗為關注的改善。 因此我們開始思考:這樣的進步是否有時間上的固定模式? 我們今年也會觀察到有如 2021 年的情形嗎? 我們會持續追蹤這些引擎的 MT 效能,並在下個月左右報告我們的發現。

總的來說,人們對 MT 引擎評估越來越感興趣。 時至今日,大多數的人都同意,MT 已是個成熟的技術。 無論是否採用人工干預還是混合作法,人們已經體認到這個技術對幾乎任何翻譯案例而言都很實用。 但該如何妥善地評估、衡量與改善 MT 結果,MT 使用者則仍在求取合適的評估方式。

—Lionbridge 創新副總裁 Rafa Moral

按一下這裡閱讀之前的專家評論。

評估整體 MT 表現
MT 引擎之比較
時間
不同語言的 MT 品質評估 - 反向編輯距離
在下拉式選單中選取德文、西班牙文、俄文或中文
時間
不同領域的表現
在下拉式選單中選取一種領域
時間

如要了解機器翻譯的未來趨勢或其他深入分析,歡迎閱讀我們的「語言技術的未來」部落格文章:機器翻譯的未來

Lionbridge 機器翻譯追蹤工具的原理

Lionbridge 是採用編輯更動程度,又名反向編輯距離 (inverse edit distance),來進行計分。編輯更動程度評量的是機器與人工翻譯之間的差異,其原理是計算編譯人員對機器翻譯所更動的字符 (亞洲語言) 或單字 (歐美語言) 的數量,再以這些數字做為機器翻譯的衡量標準。分數越高,代表品質越好。

在我們評估的四個機器翻譯引擎中,以 Google 與 Bing 神經機器翻譯 (NMT) 在翻譯多種語言及一般內容上的表現最好。然而,若以特定的語言組合來看,較專業化的引擎表現就更好:DeepL 翻譯德文時表現最優異,而 Amazon 則在翻譯中文上居冠。

免責聲明

  1. Lionbridge 每個月會評估一次本報告中的機器翻譯引擎。
  2. 此處提供的資料僅為說明示意之用,每個案例都應個別處理與評估。
  3. 本報告是根據 Lionbridge 機器翻譯團隊預先挑選的來源資料所製作。每個機器翻譯引擎的每種語言組合都是使用相同的來源資料,因此得以比較其表現。
  4. 本報告的製作過程中並未使用任何客戶資料。

與我們聯絡