語言:
語言:
不管是文字、語音、音訊、視訊還是結構化或非結構化資料,我們創作、轉換、測試和訓練的內容數量在全球無人可及。
Lionbridge 專家深知您所在產業的動態與面臨的挑戰。
駕馭 Lionbridge Lainguage Cloud 的強大威力,以支援您的端對端本地化作業和內容生命週期
駕馭 Lionbridge Lainguage Cloud 的強大威力,以支援您的端對端本地化作業和內容生命週期
Lainguage Cloud™ 平台
連線能力
翻譯社群
工作流程技術
Smairt Content™
Smairt MT™
Smairt Data™
選擇語言:
機器翻譯 (MT) 問世已有多年,但一直到近幾年,它的進展才突飛猛進。隨著企業需要以多種不同語言創作更多內容,他們也更加看好機器翻譯這項技術,以協助他們在日漸全球化的世界觸及更多客群。
想部署機器翻譯的企業,有四種基本策略可以選擇:
無論採取什麼策略,如果沒有適當的資料與經驗,往往就很難挑選出合適的引擎。Lionbridge 在機器翻譯領域耕耘超過 20 年,具有豐富經驗,更在機器翻譯技術方面收集了大量的語言和品質資料,能協助客戶做出最適當的選擇。本網頁將針對最常見的語言組合,提供機器翻譯引擎表現的基本資訊,進而協助企業做出最適合自己內容的選擇。
在市面上許多 MT 系統中做選擇,您一定要知道:有些引擎會更擅長處理特定功能或領域。 如果您的需求並不包含這些功能或領域,那麼就算這些引擎的技術再先進,對您而言,其效能表現可能還是不盡理想。 因此要找到您的最佳選擇,首要之務就是要了解您使用 MT 的理由。
如果您要將 MT 引擎用於一般用途,Google 翻譯或 Bing 翻譯工具會是不錯的合適選擇; 如果是想針對特定語言或領域使用 MT,那麼改為使用 Amazon Translate 或 DeepL 翻譯器 (DeepL Translator) 可能會有更好的成果。
Lionbridge 的機器翻譯追蹤工具每個月都會分析各大引擎的效能表現,協助您根據自己的語言組合找出最適合您的 MT 引擎。 因此下次想知道哪一款 MT 引擎最好時,不妨將問題改成:「那一款 MT 引擎最適合我?」,並參考 Lionbridge 的分析指引做出明智的選擇。
對於想將翻譯作業自動化的公司而言,常見機器翻譯 (MT) 引擎的輸出結果通常已經足夠因應需求。 然而,這些引擎也可能會產出品質不佳的結果,尤其是處理技術性或高度專業的內容時,這種傾向會更明顯。
如果公司想改進機器翻譯 (MT) 的結果以求達成特定目標,可以考慮以下兩個選項: MT 自訂和/或 MT 訓練。 無論使用哪一種方法,還是將兩者結合在一起,都有助自動化翻譯流程產出更好的結果。
然而,這兩種作法並不相同,因此無法互相替代。 表 1 大概說明了 MT 自訂與 MT 訓練,並就評量各個方式時可考量的因素提供一些建議。
MT 自訂 | MT 訓練 | |
---|---|---|
意義及運作方式 | 使用詞彙表及「請勿翻譯」(DNT) 清單來調整既有的機器翻譯引擎,藉此改善機器生成翻譯的正確性 | 使用來自語料庫及翻譯記憶庫 (TM) 的龐大雙語資料,來建置與訓練 MT 引擎,藉此改善機器生成翻譯的正確性 |
功用 | 改善 MT 的翻譯建議,產出更正確的輸出並減少對譯後編修的需求 | 改善 MT 的翻譯建議,產出更正確的輸出並減少對譯後編修的需求 |
特有好處 | 能讓公司保持其品牌名稱、遵循所應使用的術語,並顧及地區性差異 | 能讓公司展現特有的品牌調性、語氣和風格,並顧及地區性差異 |
使用的風險 | 如果執行不當,MT 可能會產出品質不佳的翻譯建議,對整體品質帶來負面影響 | 如果沒有足夠的資料來訓練引擎,MT 訓練可能無法對輸出有任何影響;如果編寫人員經驗不足,使用太多不必要的術語,可能會導致 MT 產出品質不佳的翻譯建議,對整體品質帶來負面影響 |
使用時機 | 非常適合技術性以及講究細節的內容,以及有以下要求的任何內容: *正確的術語翻譯 *地區性差異,但缺乏足夠的資料進行 MT 訓練 |
非常適合高度專業的內容、行銷與創意內容,以及有以下要求的任何內容: *特有的品牌調性、語氣或風格 *地區性差異,且有足夠的資料進行 MT 訓練 |
成功要素 | 由經驗豐富的 MT 專家,為您成功管理輸入與輸出正規化規則、詞彙表和 DNT | 要有最低 15K 獨特不重複的句段,才足以訓練引擎 |
成本考量 | 更新 MT 所用的設定檔會有個一次性支付的成本,日後也需要隨時間維護詞彙表;若將潛在好處納入考量,成本相對而言並不昂貴,而且通常比 MT 訓練的成本來得低 | 成本包括初次訓練及後續訓練的成本,如果 MT 表現監測顯示還有改進的空間,成本亦會隨時間增加;若將潛在好處納入考量,MT 訓練對特定案例會是值回票價的投資 |
表 1. MT 自訂與 MT 訓練之比較
歡迎閱讀我們的部落格文章,深入了解機器翻譯自訂與機器翻譯訓練。
—Thomas McCarthy,Lionbridge MT 業務分析師
對機器翻譯 (MT) 來說,大型語言模型 (LLM) 會是神經機器翻譯 (NMT) 之外的另一個可能典範嗎? 為了找出這個問題的答案,我們將 OpenAI 最新的 LLM,也就是 GPT-3 系列的ChatGPT,與我們機器翻譯追蹤工具中使用的五大主流 MT 引擎,就其翻譯表現進行比較。
一如預期,專業化 NMT 引擎的翻譯表現優於 ChatGPT。 但令人驚訝的是,ChatGPT 的表現其實挺不錯的。 如圖 1 所示,ChatGPT 的成果非常接近專業化引擎。
為了評估翻譯的品質層級,我們選用英文譯至西文這個語言組合的多個參考翻譯來計算編輯更動程度,又名反向編輯距離 (inverse edit distance)。 編輯更動程度評量的是編譯人員為了取得與人工翻譯一樣的高品質結果,而對 MT 輸出所做的編輯更動次數。 在計算時,我們會將原始的 MT 輸出,與 10 個 (而非僅只 1 個) 不同的人工翻譯 (也就是多個參考翻譯) 相比較, 所得的反向編輯距離越高,代表品質越好。
這些結果非常值得我們注意,因為這個通用模型是訓練用以執行自然語言處理 (NLP) 任務,並未特地受過執行翻譯的訓練。 而 ChatGPT 的表現,已經接近高品質 MT 引擎在兩、三年前的成績了。
從大眾的關注與科技公司對這個技術的大量投資,都可看出 LLM 有長足的進步,因此我們應該很快就能知道,究竟是 ChatGPT 會超越 MT 引擎,還是 MT 將開始採用新的 LLM 典範。 MT 或許會以 LLM 為基礎,但針對機器翻譯微調這項技術。 這會很像 OpenAI 及其他 LLM 公司目前的作法,也就是針對特定使用案例去改進他們的通用模型,例如讓機器能以對話聊天的方式與人類溝通。 至於專業化則可進一步讓所執行的任務更加準確。
這些大型語言「通用」模型的一個好處,是它們可以執行很多不同的任務,而且多數時候都能提供卓越的品質。 舉例來說,另一個通用智慧模型,DeepMind 的 GATO,便曾做過超過 600 種任務的測試,並在其中 400 種取得最先進 (SOTA) 結果。
這樣看來,將有兩個開發路線會繼續存在,一個是像 GPT、Megatron 和 GATO 這類通用模型,另一個則是以通用模型為基礎再針對特定用途加以專業化的模型。 通用模型對推進「通用人工智慧」(AGI) 非常重要,以長程來看甚至可望催生更令人期待的發展。 專業化模型則能在短期內於特定領域中發揮實際功用。 而 LLM 令人讚嘆的其中一點,就是它可以同時參與這兩個路線的發展。
對於未來,我們非常期待, 也將會繼續評估 LLM 並發表結果,讓各位可以掌握這個令人振奮演進的最新狀況。 歡迎閱讀我們的部落格,深入探究 ChatGPT 的翻譯表現,並進一步了解 ChatGTP 與本地化以及它為何可能徹底改變本地化產業。
—Lionbridge 創新副總裁 Rafa Moral
免責聲明