我們擁有引以為傲的出色員工,20 多年來成功協助無數公司企業打動他們的客戶。 

公司簡介
重要資訊
領導團隊
深入見解
最新消息
信任中心

駕馭 Lionbridge Lainguage Cloud 的強大威力,以支援您的端對端本地化作業和內容生命週期

Lainguage Cloud™ 平台
連線能力
翻譯社群
工作流程技術
Smairt Content™
Smairt MT™
Smairt Data™

選擇語言:

Lionbridge 機器翻譯追蹤工具 (Lionbridge Machine Translation Tracker)

鄭重介紹我們的評估工具,協助您挑選最符合需求的機器翻譯引擎

簡介

機器翻譯 (MT) 問世已有多年,但一直到近幾年,它的進展才突飛猛進。隨著企業需要以多種不同語言創作更多內容,他們也更加看好機器翻譯這項技術,以協助他們在日漸全球化的世界觸及更多客群。

想部署機器翻譯的企業,有四種基本策略可以選擇:

公用 MT

使用 Google 或 Bing 這類的翻譯服務。這些服務可供任何人隨時隨地免費使用,但不提供像是自訂術語這類進階功能,同時資料可能也會被用於其他服務。

內部 MT

採用這種作法的企業,必須在他們的 IT 環境中部署機器翻譯伺服器。這麼做雖然安全性高,但所費不貲,部署與管理也非常複雜,而且需要持續不斷地維護。

雲端 MT

使用方式類似公用 MT,不過伺服器是在雲端代管,而且可以建立公司專屬的執行個體,所有與服務分享的資訊都會受到嚴密保護,不會與第三方分享。這類服務能提供自訂術語和其他便利功能,但往往會導致企業必須仰賴特定一家廠商,而且也難以在不同語言組合間得到最佳的機器翻譯品質。

業內最佳 MT

可以管理多個機器翻譯引擎的單一平台,能提供一套集中管理的自訂術語、簡易好用的介面,並可針對不同的語言組合與內容類型選擇最合適的引擎。

無論採取什麼策略,如果沒有適當的資料與經驗,往往就很難挑選出合適的引擎。Lionbridge 在機器翻譯領域耕耘超過 20 年,具有豐富經驗,更在機器翻譯技術方面收集了大量的語言和品質資料,能協助客戶做出最適當的選擇。本網頁將針對最常見的語言組合,提供機器翻譯引擎表現的基本資訊,進而協助企業做出最適合自己內容的選擇。

哪一款機器翻譯 (MT) 引擎最好? 這個答案並沒有那麼簡單。


在市面上許多 MT 系統中做選擇,您一定要知道:有些引擎會更擅長處理特定功能或領域。 如果您的需求並不包含這些功能或領域,那麼就算這些引擎的技術再先進,對您而言,其效能表現可能還是不盡理想。 因此要找到您的最佳選擇,首要之務就是要了解您使用 MT 的理由。

如果您要將 MT 引擎用於一般用途,Google 翻譯或 Bing 翻譯工具會是不錯的合適選擇; 如果是想針對特定語言或領域使用 MT,那麼改為使用 Amazon Translate 或 DeepL 翻譯器 (DeepL Translator) 可能會有更好的成果。

Lionbridge 的機器翻譯追蹤工具每個月都會分析各大引擎的效能表現,協助您根據自己的語言組合找出最適合您的 MT 引擎。 因此下次想知道哪一款 MT 引擎最好時,不妨將問題改成:「那一款 MT 引擎最適合我?」,並參考 Lionbridge 的分析指引做出明智的選擇。

想進一步了解不同類型的機器翻譯技術嗎?請參閱我們的部落格文章:機器翻譯詞彙解釋

Lionbridge 專家評論

2023 年 10 月

有鑑於生成式 AI (GenAI)/大型語言模型 (LLM) 的盛行與興起,我們亦順應潮流改善了 Lionbridge 機器翻譯 (MT) 品質追蹤工具報告。 從此之後,報告中除了 GPT-3.5 與 Davinci 的結果以及神經 MT (NMT) 引擎的表現外,也會將 GPT-4 翻譯結果納入分析。

我們的最新分析得出哪些結果? GPT-4 有些值得注意的不尋常表現。

我們遇到了幾個與 GPT-4 相關的問題,包括效能緩慢、基於多種不同原因無法提供翻譯,以及行為不一致,例如有的執行有漏譯但其他執行則沒有。

分析結果 #1 — GPT-4 無法翻譯某些文字。

GPT-4 無法翻譯我們 MT 測試集中的某個特定句子。

做了些調查後,我們判斷應該是某個詞彙在特定脈絡下會有性方面的意涵,因此造成這個問題。 必須要澄清的是,我們測試集中的這個句子,是完全符合標準且可接受的。 然而,這個詞仍舊觸發了 GPT-4 的性相關內容過濾功能,導致 AI 在審查該句子後決定不輸出其翻譯。 這個結果讓我們頗感意外,有兩個原因:

單獨來看,該詞彙的一般字義並沒有什麼問題。

從前後文來看,該句子也不會有什麼不妥的解釋。

這個觀察結果讓我們得出結論,GPT-4 的內容過濾機制有部分可能是採用簡單的禁用字詞清單,而其中也包含了一些有歧義的字詞。 這種作法的問題在於,它很容易會反應過度而造成錯誤辨識,這對專業翻譯而言是很嚴重的問題。

由於先前的機器翻譯技術,例如神經 MT 引擎等,並未出現過這種類型的內容過濾問題,因此我們推斷這是 LLM 技術的一項侷限。

但現實世界的一些情況會受到這個侷限影響。 舉例來說,假設您需要翻譯與婦科或是性教育相關的醫學內容, 很可能會訝異地發現有些內容不會被 LLM 翻譯。

有趣的是,只有在將這個句子翻譯至中文這個特定語言時,我們才會遇到這個問題,翻譯至其他語言則不會。 而這也顯示 GPT-4 是對輸出進行內容過濾。 解決這個問題的辦法,就是在進行翻譯任務時關閉內容過濾功能。

分析結果 #2 — GPT-4 輸出的變異性。

追蹤翻譯表現五個星期後,我們發現 LLM 機器翻譯輸出的變異性非常大,尤其是 GPT-4。

我們本來就預料到生成式 AI 會有這種結果,但即使透過溫度 (Temperature) 以及最高機率 (Top Probability,Top_p) 等參數設定來降低創意程度,試圖讓輸出更加確切一致,所得到結果的變異性還是遠比我們預測的來得高。 就算是執行完一次翻譯後緊接著馬上再執行一次,每一次 GPT 執行所得到的翻譯輸出也都不一樣。

這兩個翻譯雖然不一樣,但都是可接受的結果。 然而,這是另一層面的控制,也是它與前一個神經 MT 典範的另一個不同之處。

我們開始直覺地體認到,從 NMT 轉變為 LLM MT 典範這個可能的變革,或許不光是技術上的變革,還更需要改變我們的思維: 我們可能得做好心理準備,接受就算使用完全一樣的輸入以及參數,也可能會得到沒那麼確切一致的輸出,此外結果的變異性也會比目前慣常使用的自動化作業來得高。

雖然我們在某種程度上得接受不確定性的增加,但或許也能利用一些機制和最佳實務做法,稍加控制這種變異性。

最後,在檢視圖表時,請注意 GPT-4 編輯更動程度線條的下降,並不代表其品質下降, 這只是反映了 GPT 輸出的變異性罷了。 在下個月的報告中,就可能看到它往上走。 歡迎關注這裡,了解相關發展及更多深入見解。

 

    —Lionbridge 創新副總裁 Rafa Moral

按一下這裡閱讀之前的專家評論。

評估整體 MT 表現
MT 引擎之比較
時間
不同語言的 MT 品質評估 - 反向編輯距離
請從下拉式選單中選擇德文、西班牙文、俄文或中文
時間
不同領域的表現
請從下拉式選單中選擇領域/主題
時間

如要了解機器翻譯的未來趨勢或其他深入分析,歡迎閱讀我們的「語言技術的未來」部落格文章:機器翻譯的未來

Lionbridge 機器翻譯追蹤工具的原理

Lionbridge 是採用編輯更動程度,又名反向編輯距離 (inverse edit distance),來進行計分。編輯更動程度評量的是機器與人工翻譯之間的差異,其原理是計算編譯人員對機器翻譯所更動的字符 (亞洲語言) 或單字 (歐美語言) 的數量,再以這些數字做為機器翻譯的衡量標準。分數越高,代表品質越好。

在我們評估的四個機器翻譯引擎中,以 Google 與 Bing 神經機器翻譯 (NMT) 在翻譯多種語言及一般內容上的表現最好。然而,若以特定的語言組合來看,較專業化的引擎表現就更好:DeepL 翻譯德文時表現最優異,而 Amazon 則在翻譯中文上居冠。

免責聲明

  1. Lionbridge 每個月會評估一次本報告中的機器翻譯引擎。
  2. 此處提供的資料僅為說明示意之用,每個案例都應個別處理與評估。
  3. 本報告是根據 Lionbridge 機器翻譯團隊預先挑選的來源資料所製作。每個機器翻譯引擎的每種語言組合都是使用相同的來源資料,因此得以比較其表現。
  4. 本報告的製作過程中並未使用任何客戶資料。

藉助 Smaⁱrter™ 之力,踏上 MT 的成功之道

Smaⁱrt MT™:數位時代的翻譯公司提供全新機器翻譯技術

許多企業逐步進行數字化/數位化轉型,以各種方式將 MT 加入内容創作流程,並透過譯後編修 (MTPE) 提升翻譯品質。歡迎查看我們的 MT 翻譯中心了解詳情。

語言技術的未來:機器翻譯的未來

機器翻譯將持續不斷發展,只要部署得宜,對提升翻譯生產力也會越來越重要。

機器翻譯和機器翻譯加譯後編修 (MTPE)

什麼時候最適合使用機器翻譯?什麼時候又該考慮採用結合傳統人工翻譯的混合模式?本文特地探討了各種情境。 

神經機器翻譯:人工智慧在語言翻譯中扮演的角色

深入了解何謂神經機器翻譯,以及為何一般認為它會徹底改變整個語言產業。

翻譯和在地化相關:機器翻譯詞彙解釋

使用這份實用的速查表,您就能迅速了解有關機器翻譯的重要詞彙。 

歡迎按一下下方影像,檢視了解機器翻譯的一些重要定義。

與我們聯絡