選擇語言:

Lionbridge 機器翻譯追蹤工具 (Lionbridge Machine Translation Tracker)

鄭重介紹我們的評估工具,協助您挑選最符合需求的機器翻譯引擎

簡介

機器翻譯 (MT) 問世已有多年,但一直到近幾年,它的進展才突飛猛進。隨著企業需要以多種不同語言創作更多內容,他們也更加看好機器翻譯這項技術,以協助他們在日漸全球化的世界觸及更多客群。

想部署機器翻譯的企業,有四種基本策略可以選擇:

公用 MT

使用 Google 或 Bing 這類的翻譯服務。這些服務可供任何人隨時隨地免費使用,但不提供像是自訂術語這類進階功能,同時資料可能也會被用於其他服務。

內部 MT

採用這種作法的企業,必須在他們的 IT 環境中部署機器翻譯伺服器。這麼做雖然安全性高,但所費不貲,部署與管理也非常複雜,而且需要持續不斷地維護。

雲端 MT

使用方式類似公用 MT,不過伺服器是在雲端代管,而且可以建立公司專屬的執行個體,所有與服務分享的資訊都會受到嚴密保護,不會與第三方分享。這類服務能提供自訂術語和其他便利功能,但往往會導致企業必須仰賴特定一家廠商,而且也難以在不同語言組合間得到最佳的機器翻譯品質。

業內最佳 MT

可以管理多個機器翻譯引擎的單一平台,能提供一套集中管理的自訂術語、簡易好用的介面,並可針對不同的語言組合與內容類型選擇最合適的引擎。

無論採取什麼策略,如果沒有適當的資料與經驗,往往就很難挑選出合適的引擎。Lionbridge 在機器翻譯領域耕耘超過 20 年,具有豐富經驗,更在機器翻譯技術方面收集了大量的語言和品質資料,能協助客戶做出最適當的選擇。本網頁將針對最常見的語言組合,提供機器翻譯引擎表現的基本資訊,進而協助企業做出最適合自己內容的選擇。

哪一款機器翻譯 (MT) 引擎最好? 這個答案並沒有那麼簡單。


在市面上許多 MT 系統中做選擇,您一定要知道:有些引擎會更擅長處理特定功能或領域。 如果您的需求並不包含這些功能或領域,那麼就算這些引擎的技術再先進,對您而言,其效能表現可能還是不盡理想。 因此要找到您的最佳選擇,首要之務就是要了解您使用 MT 的理由。

如果您要將 MT 引擎用於一般用途,Google 翻譯或 Bing 翻譯工具會是不錯的合適選擇; 如果是想針對特定語言或領域使用 MT,那麼改為使用 Amazon Translate 或 DeepL 翻譯器 (DeepL Translator) 可能會有更好的成果。

Lionbridge 的機器翻譯追蹤工具每個月都會分析各大引擎的效能表現,協助您根據自己的語言組合找出最適合您的 MT 引擎。 因此下次想知道哪一款 MT 引擎最好時,不妨將問題改成:「那一款 MT 引擎最適合我?」,並參考 Lionbridge 的分析指引做出明智的選擇。

想進一步了解不同類型的機器翻譯技術嗎?請參閱我們的部落格文章:機器翻譯詞彙解釋

Lionbridge 專家評論

2023 年 2 月

對於想將翻譯作業自動化的公司而言,常見機器翻譯 (MT) 引擎的輸出結果通常已經足夠因應需求。 然而,這些引擎也可能會產出品質不佳的結果,尤其是處理技術性或高度專業的內容時,這種傾向會更明顯。

如果公司想改進機器翻譯 (MT) 的結果以求達成特定目標,可以考慮以下兩個選項: MT 自訂和/或 MT 訓練。 無論使用哪一種方法,還是將兩者結合在一起,都有助自動化翻譯流程產出更好的結果。

然而,這兩種作法並不相同,因此無法互相替代。 表 1 大概說明了 MT 自訂與 MT 訓練,並就評量各個方式時可考量的因素提供一些建議。

機器翻譯自訂與機器翻譯訓練

  MT 自訂 MT 訓練
意義及運作方式 使用詞彙表及「請勿翻譯」(DNT) 清單來調整既有的機器翻譯引擎,藉此改善機器生成翻譯的正確性 使用來自語料庫及翻譯記憶庫 (TM) 的龐大雙語資料,來建置與訓練 MT 引擎,藉此改善機器生成翻譯的正確性
功用 改善 MT 的翻譯建議,產出更正確的輸出並減少對譯後編修的需求 改善 MT 的翻譯建議,產出更正確的輸出並減少對譯後編修的需求
特有好處 能讓公司保持其品牌名稱、遵循所應使用的術語,並顧及地區性差異 能讓公司展現特有的品牌調性、語氣和風格,並顧及地區性差異
使用的風險 如果執行不當,MT 可能會產出品質不佳的翻譯建議,對整體品質帶來負面影響 如果沒有足夠的資料來訓練引擎,MT 訓練可能無法對輸出有任何影響;如果編寫人員經驗不足,使用太多不必要的術語,可能會導致 MT 產出品質不佳的翻譯建議,對整體品質帶來負面影響
使用時機 非常適合技術性以及講究細節的內容,以及有以下要求的任何內容:
*正確的術語翻譯
*地區性差異,但缺乏足夠的資料進行 MT 訓練
非常適合高度專業的內容、行銷與創意內容,以及有以下要求的任何內容:
*特有的品牌調性、語氣或風格
*地區性差異,且有足夠的資料進行 MT 訓練
成功要素 由經驗豐富的 MT 專家,為您成功管理輸入與輸出正規化規則、詞彙表和 DNT 要有最低 15K 獨特不重複的句段,才足以訓練引擎
成本考量 更新 MT 所用的設定檔會有個一次性支付的成本,日後也需要隨時間維護詞彙表;若將潛在好處納入考量,成本相對而言並不昂貴,而且通常比 MT 訓練的成本來得低 成本包括初次訓練及後續訓練的成本,如果 MT 表現監測顯示還有改進的空間,成本亦會隨時間增加;若將潛在好處納入考量,MT 訓練對特定案例會是值回票價的投資

表 1. MT 自訂與 MT 訓練之比較

歡迎閱讀我們的部落格文章,深入了解機器翻譯自訂與機器翻譯訓練

 

    —Thomas McCarthy,Lionbridge MT 業務分析師

2023 年 1 月

對機器翻譯 (MT) 來說,大型語言模型 (LLM) 會是神經機器翻譯 (NMT) 之外的另一個可能典範嗎? 為了找出這個問題的答案,我們將 OpenAI 最新的 LLM,也就是 GPT-3 系列的ChatGPT,與我們機器翻譯追蹤工具中使用的五大主流 MT 引擎,就其翻譯表現進行比較。

一如預期,專業化 NMT 引擎的翻譯表現優於 ChatGPT。 但令人驚訝的是,ChatGPT 的表現其實挺不錯的。 如圖 1 所示,ChatGPT 的成果非常接近專業化引擎。

為了評估翻譯的品質層級,我們選用英文譯至西文這個語言組合的多個參考翻譯來計算編輯更動程度,又名反向編輯距離 (inverse edit distance)。 編輯更動程度評量的是編譯人員為了取得與人工翻譯一樣的高品質結果,而對 MT 輸出所做的編輯更動次數。 在計算時,我們會將原始的 MT 輸出,與 10 個 (而非僅只 1 個) 不同的人工翻譯 (也就是多個參考翻譯) 相比較, 所得的反向編輯距離越高,代表品質越好。

圖 1. 根據英翻西這個語言組合的多個參考翻譯計算反向編輯距離,比較 ChatGPT 與主流機器翻譯引擎的自動翻譯品質。

這些結果非常值得我們注意,因為這個通用模型是訓練用以執行自然語言處理 (NLP) 任務,並未特地受過執行翻譯的訓練。 而 ChatGPT 的表現,已經接近高品質 MT 引擎在兩、三年前的成績了。

從大眾的關注與科技公司對這個技術的大量投資,都可看出 LLM 有長足的進步,因此我們應該很快就能知道,究竟是 ChatGPT 會超越 MT 引擎,還是 MT 將開始採用新的 LLM 典範。 MT 或許會以 LLM 為基礎,但針對機器翻譯微調這項技術。 這會很像 OpenAI 及其他 LLM 公司目前的作法,也就是針對特定使用案例去改進他們的通用模型,例如讓機器能以對話聊天的方式與人類溝通。 至於專業化則可進一步讓所執行的任務更加準確。

這些大型語言「通用」模型的一個好處,是它們可以執行很多不同的任務,而且多數時候都能提供卓越的品質。 舉例來說,另一個通用智慧模型,DeepMind 的 GATO,便曾做過超過 600 種任務的測試,並在其中 400 種取得最先進 (SOTA) 結果。

這樣看來,將有兩個開發路線會繼續存在,一個是像 GPT、Megatron 和 GATO 這類通用模型,另一個則是以通用模型為基礎再針對特定用途加以專業化的模型。 通用模型對推進「通用人工智慧」(AGI) 非常重要,以長程來看甚至可望催生更令人期待的發展。 專業化模型則能在短期內於特定領域中發揮實際功用。 而 LLM 令人讚嘆的其中一點,就是它可以同時參與這兩個路線的發展。

對於未來,我們非常期待, 也將會繼續評估 LLM 並發表結果,讓各位可以掌握這個令人振奮演進的最新狀況。 歡迎閱讀我們的部落格,深入探究 ChatGPT 的翻譯表現,並進一步了解 ChatGTP 與本地化以及它為何可能徹底改變本地化產業。

 

    —Lionbridge 創新副總裁 Rafa Moral

按一下這裡閱讀之前的專家評論。

評估整體 MT 表現
MT 引擎之比較
時間
不同語言的 MT 品質評估 - 反向編輯距離
請從下拉式選單中選擇德文、西班牙文、俄文或中文
時間
不同領域的表現
請從下拉式選單中選擇領域/主題
時間

如要了解機器翻譯的未來趨勢或其他深入分析,歡迎閱讀我們的「語言技術的未來」部落格文章:機器翻譯的未來

Lionbridge 機器翻譯追蹤工具的原理

Lionbridge 是採用編輯更動程度,又名反向編輯距離 (inverse edit distance),來進行計分。編輯更動程度評量的是機器與人工翻譯之間的差異,其原理是計算編譯人員對機器翻譯所更動的字符 (亞洲語言) 或單字 (歐美語言) 的數量,再以這些數字做為機器翻譯的衡量標準。分數越高,代表品質越好。

在我們評估的四個機器翻譯引擎中,以 Google 與 Bing 神經機器翻譯 (NMT) 在翻譯多種語言及一般內容上的表現最好。然而,若以特定的語言組合來看,較專業化的引擎表現就更好:DeepL 翻譯德文時表現最優異,而 Amazon 則在翻譯中文上居冠。

免責聲明

  1. Lionbridge 每個月會評估一次本報告中的機器翻譯引擎。
  2. 此處提供的資料僅為說明示意之用,每個案例都應個別處理與評估。
  3. 本報告是根據 Lionbridge 機器翻譯團隊預先挑選的來源資料所製作。每個機器翻譯引擎的每種語言組合都是使用相同的來源資料,因此得以比較其表現。
  4. 本報告的製作過程中並未使用任何客戶資料。

藉助 Smaⁱrter™ 之力,踏上 MT 的成功之道

Smaⁱrt MT™:數位時代的翻譯公司提供全新機器翻譯技術

許多企業逐步進行數字化/數位化轉型,以各種方式將 MT 加入内容創作流程,並透過譯後編修 (MTPE) 提升翻譯品質。歡迎查看我們的 MT 翻譯中心了解詳情。

語言技術的未來:機器翻譯的未來

機器翻譯將持續不斷發展,只要部署得宜,對提升翻譯生產力也會越來越重要。

機器翻譯和機器翻譯加譯後編修 (MTPE)

什麼時候最適合使用機器翻譯?什麼時候又該考慮採用結合傳統人工翻譯的混合模式?本文特地探討了各種情境。 

神經機器翻譯:人工智慧在語言翻譯中扮演的角色

深入了解何謂神經機器翻譯,以及為何一般認為它會徹底改變整個語言產業。

翻譯和在地化相關:機器翻譯詞彙解釋

使用這份實用的速查表,您就能迅速了解有關機器翻譯的重要詞彙。 

歡迎按一下下方影像,檢視了解機器翻譯的一些重要定義。

與我們聯絡