1. 關於我們
Allie Fritz, Lionbridge 口譯主管

認識我們的出色員工:Allie Fritz

Lionbridge 口譯主管

mobile-toggle

選擇語言:

一名商務人士站在舞台上,手裡拿著發亮的提燈,象徵他對 LLM 成效表現有了新的深入見解。
一名商務人士站在舞台上,手裡拿著發亮的提燈,象徵他對 LLM 成效表現有了新的深入見解。

線上研討會重點摘要:翻譯總是不夠達意?

了解影響 LLM 成效的因素,進而改善翻譯品質

「如果您有開發內部 LLM 或 AI 解決方案,我們非常鼓勵您使用… 並了解哪些內容類型最適合它們。我們也很樂意在這個歷程中協助您,讓您能了解自己的解決方案會產出什麼樣的輸出。

— 全球解決方案副總裁 Simone Lamont

覺得翻譯總是不夠達意?隨著大型語言模型 (LLM) 的快速發展,公司企業也在探索各種新的應用方式,來自動化翻譯並拓展其規模。然而,其中許多都遇到 LLM 實際結果的問題,這往往決定了他們是成功執行生成式 AI 專案,還是一場最終只能放棄的昂貴實驗。

在我們的線上研討會「翻譯總是不夠達意?」中,Lionbridge 全球解決方案副總裁 Simone Lamont 便探討了組織使用 LLM 進行翻譯專案時會遇到的主要挑戰,以及如何克服這些問題以取得高品質的多語言內容。

想觀看完整的線上研討會嗎?請使用下方按鈕前往觀看錄影。

  • #life_sciences
  • #content_transformation
  • #generative-ai
  • #automotive
  • #industrial_manufacturing
  • #technology
  • #ai-training
  • #retail
  • #content_creation
  • #webinar
  • #consumer_packaged_goods
  • #ai
  • #blog_posts
  • #legal_services
  • #translation_localization
  • #travel_hospitality

全球各地的組織紛紛推行 AI 專案,並將 LLM 整合至他們的工作流程中。這確實是令人振奮的發展,但隨之而來的挫折也確實令人失望。

事實上,有 72% 的 AI 專案在還沒產生任何價值之前,就遭到放棄。理由何在?翻譯品質未能達標、經常發生幻覺和解讀錯誤,以及內部團隊缺少能針對各個目標語言自訂 LLM 的專業知識等。

AI 解決方案有哪些品質問題,實際狀況又是如何?

LLM 雖然具備速度和規模這些優點,但若沒有審慎細心地設置,也可能會產生錯誤,進而傷害到利害關係人士和品牌可信度。

組織回報的問題包括:品牌名稱翻譯錯誤、數字及度量衡處理錯誤,以及術語不一致等,如果 LLM 是由內部進行訓練但又缺乏適當的語言資產時,這些情況更是嚴重。

另一個挑戰則是必須要有一定的時間與技巧,才能進行有效的提示工程。為例如中文、德文或法文等語言自訂解決方案時,需要同時具備技術和語言方面的專業知識,但許多團隊無法兩者兼備。採用 AI 技術的翻譯即使能應付小規模的專案,往往也難以擴展到企業工作流程上。

位於字母和數字方塊上方的迷宮,象徵著 LLM 成效表現的複雜性。

與 MT 解決方案相比,預訓練的 LLM 在翻譯應用上有何差別?

立即可用的 ChatGPT 或任何 LLM 能產出足以供企業使用的翻譯品質嗎?根據 Lionbridge 機器翻譯追蹤工具所做的基準分析,標準的預訓練 LLM 在翻譯上的表現,一般而言不如傳統的機器翻譯引擎與混合式解決方案來得好。細微調整以及檢索增強生成 (RAG) 可以改善品質,然而重要的是,您得要知道這些技巧的使用時機與方式以及如何測試生成的結果,才能接著將採用 AI 的解決方案提供給貴組織使用。

應該如何根據內容類型來決定品質層級?

不是所有的內容都需要相同的翻譯品質層級。這場線上研討會中便強調了依據內容風險與業務需求,來選擇合適的工作流程的重要性。舉例來說,行銷用的新聞稿需要高度的正確性和品牌一致性,簡單的網站更新則可以容忍有些稍微不通順的地方。

對錯誤的容忍度會因內容類型而異:
  • 醫院病床手冊跟心臟節律器手冊對正確性的要求就截然不同。

  • 對醫療及法律文件來說,零錯誤是不容妥協的要求。

  • 對其他類型的內容而言,速度和成本有時可能會比完美精準來得重要。

了解自己的內容非常重要。Lionbridge 的 REACH 架構會請您考慮投資報酬率 (ROI)、互動、目標對象及控管這些因素,為各個使用案例決定最合適的做法以及所需的人機迴圈程度。內容是僅供資訊參考用嗎?是專業、受法律規範或高影響力的內容嗎?這些問題決定了您所要使用的工作流程 — 從沒有人工審閱的 LLM 翻譯到由專家進行完整的驗證。

自訂與人工審閱如何能改善翻譯工作流程?

自訂很重要。我們 AI 優先的平台 Lionbridge Aurora AI™,就能運用翻譯記憶庫 (TM)、詞彙表、動態提示及採用 LLM 的譯後編修等功能。這種做法一方面可以減少人力需求,一方面也能提升翻譯品質。您可以針對各個使用案例自訂其語氣、風格及術語,即使是較少見的語言也沒問題。

Simone 也強調了持續評估的重要性。Lionbridge 提供的自動評量功能,可根據術語、正確性、風格、地區習俗以及目標對象相關性等因素,來分析翻譯的品質。這些計分卡能協助組織找出他們 AI 解決方案的優缺點,進而能更精準地改進。

以視覺方式呈現故障的電腦,代表 LLM 成效方面的挑戰。

如何評估並改善 LLM 成效表現?

如何知道您的 AI 解決方案能勝任其任務?線上研討會中提出了幾個評估 LLM 成效及翻譯品質的實用步驟:

  • 首先就從評量您目前的工作流程開始。將 LLM 或機器翻譯的輸出,與人工翻譯相比較。

  • 使用 Lionbridge 的自動品質評量功能,精準找出可改善的地方,例如術語、風格、正確性等。

  • 為不同的內容類型選擇相稱的 AI 工作流程,在成本、交付時間及可接受的錯誤率之間求取平衡。

Lionbridge 的評估服務,能協助組織確實找出 LLM 成效的問題,不必再盲目揣測。只要提交內容譯文的樣本,客戶的團隊便可收到完善的計分卡及可行的深入見解。有了這些資料,公司企業便可信心十足地使用內部 LLM 處理特定的低風險內容,並為關係重大的專案尋求專業支援。

這場線上研討會的重點總結

這場線上研討會提供了許多深入見解,能協助您在 LLM 表現不如預期時充分提高其成效。以下是重點摘要。

  • LLM 成效會因為 LLM 翻譯解決方案、相關的語言資產以及自訂程度的不同,而有很大的差異。

  • 不是所有的內容都需要相同的翻譯品質 — 應根據內容所需的結果搭配相稱的工作流程,並在成本、交付時間與風險之間求取平衡。

  • 立即可用的 LLM 表現往往不如經過細微調整或混合式的解決方案。

  • 自訂提示、詞彙表和翻譯記憶庫 (TM) 可以改善翻譯品質。

  • 對高風險或受規範的內容而言,人工審閱依然非常重要。

  • 用客觀的資料來評估您 AI 解決方案的優缺點,進而做出明智的決定。

  • Lionbridge 能提供自動評量服務,協助組織評估其 LLM 的翻譯輸出。

想進一步探索 Lionbridge 之前深入探討過的 AI 相關主題線上研討會嗎?歡迎前往 Lionbridge 線上研討會網頁,參閱此處彙整的影音資料。

與我們聯絡

想要以貴組織所需的翻譯品質,取得可靠的 LLM 成效表現嗎?Lionbridge 能協助您評量、最佳化與自訂您的專案,獲致 AI 成功。歡迎立即與我們聯絡,馬上開始體驗。

請注意:本篇重點摘要部落格文章是先以 Lionbridge Content Remix App 製作,再由人員加以調整精進。

linkedin sharing button

作者
Janette Mandell

與我們洽談

Business Email Only