面對龐大的多語言內容需求,您是否感到頭痛不已?您並不孤單。多年以來,翻譯團隊無不面臨著艱鉅的挑戰:吃緊的預算、有限的人力資源,以及市場對內容永無止盡的需求。但要是能以更快的速度交付大規模高品質的翻譯,同時又能大幅降低成本,該有多好?現在,只要運用人工智慧 (AI),便有可能實現這個夢想。
在 Lionbridge「可以用 AI 進行譯後編修嗎?」線上研討會中,來自 Lionbridge 及 Cisco Systems 的專家一同探討了 AI 譯後編修正如何改變翻譯與本地化。
這場研討會中,與會嘉賓 Lionbridge 技術長 Marcus Casal 及 Cisco Systems GTS 方案經理 Yolanda Cham Yuen 討論了關鍵的核心問題:使用大型語言模型 (LLM) 進行 AI 譯後編修,是否能交出正確、可靠又具成本效益的大規模翻譯?兩人都很肯定地說「是」,但有些非常重要的事情需要注意。
AI 可以用來進行譯後編修,而且能做得非常好。
— Lionbridge 技術長 Marcus Casal
想觀看完整的線上研討會嗎?請使用下方按鈕前往觀看錄影。
AI 譯後編修已不再是遙不可及的願景,它早已翩然到來,推動著現實世界轉型。
Lionbridge Aurora AI™ 平台能統籌協調整個全球內容生命週期,從擷取客戶資料、使用機器翻譯 (MT) 進行翻譯、使用 LLM 進行自動譯後編修,然後再將其傳回內容庫,全部一手掌握。
為何它有這樣強大的能力?因為它結合了 API 驅動的自動化功能、平台即服務 (iPaaS) 整合,以及例如翻譯記憶庫 (TM)、詞彙表和術語管理等完善的語言資產。透過將 MT、使用前沿模型的 LLM 譯後編修以及智慧型工作流程等整合在一起,組織便能以遠勝以往的速度,交出可預測性極高的內容。
但光有速度和擴充能力還不夠,品質依然是重要關鍵。因此 Lionbridge 的做法才會納入人機迴圈 (HITL) 監督機制,由人類負責訓練與調整模型並視需要評估結果,確保最終的產出能符合內容所欲達成的目標。
Yolanda 分享了 Cisco 如何在其全球社會責任倡議計畫「Cisco Networking Academy」中應用自動譯後編修。
Cisco Networking Academy 為全球 191 個國家/地區超過 2300 萬名學員提供免費的科技教育,課程主題多元,涵蓋網路、網路資安、程式設計以及其他資料科學等領域。本地化對這些課程能否發揮最大功效至關重要,因為語言往往是非常艱鉅的挑戰。
為了拓展觸及範疇,讓 Network Academy 課程能進一步為全球更多人使用,Cisco 需要一個可靈活擴展規模的解決方案,將數百萬字的內容翻譯至超過十二種語言,而且往往得在緊湊的時程和預算下完成。
他們的解方?使用自動譯後編修。
Cisco 解決方案使用的做法包括:
由之前已核准內容所組成的翻譯記憶庫。
出於速度、成本及一致性的考量,選擇由神經機器翻譯 (NMT) 進行初始翻譯。
採用 LLM 進行 AI 譯後編修,藉此調整與改善輸出。
由測試人員進行依文本脈絡功能審閱,尤其是那些複雜的語言。
他們的結果絕對令人驚艷。
使用自動譯後編修,讓 Cisco Networking Academy 得以在短短三個月內,將超過 1500 萬字翻譯至 14 種語言,為 24 個課程提供支援。流程的瓶頸也從原本的翻譯轉移到功能測試和上線準備階段,效率明顯大幅提升。所有這些工作的花費不到 70,000 美元,遠比傳統方法低廉許多。
運用 LLM 進行譯後編修,Cisco 現在可以同時以多種語言發布內容,除了大幅縮短英文與在地語言版本間的時間差距,更拓展了其課程的全球取用範疇。
「我們現在能以前所未見的速度跟成本翻譯內容,…[自動譯後編修] 為我們打開了通往新世界的大門,讓我們能以嶄新的視野看事情,解決那些以往在成本和可行性上都無法解決、極其艱難的情境。」
— Cisco Systems 的 Yolanda Cham Yuen
AI 譯後編修雖然功能強大,但並不完美。與會講者指出了一些侷限:
不管是人類還是機器,資源不足的語言通常更具挑戰性。LLM (包括前沿模型) 在英文以及常用語言的表現最好;對於小眾語言而言,專門的詞彙表跟訓練資料則非常重要。
文化細微差異、語氣以及領域專業知識,仍舊是光憑 AI 本身難以妥善處理的挑戰。無論是運動術語還是技術性語言,提示流程以及人類監督都對掌握細微差異非常重要。
幻覺,也就是 AI 生成的錯誤或誤導性資訊,有時還甚具說服力,會讓人信以為真。這個侷限更凸顯出功能測試以及直接來自使用者意見回饋的重要性,是保障高影響力內容之正確性不可或缺的做法。
Marcus 分享了一個實際的故事:某個電商網站上的某款籃球鞋刊登內容中寫著「protect your turf」(防守自己的地盤),但翻成西班牙文時卻使用了「césped」這個字 (人工草皮或草地),雖然符合足球的情境,但並不符合籃球的情境。這個錯誤後來是透過改善詞彙表和術語加以修正,並因此提高了使用者的信任度。
AI 譯後編修會取代傳統的翻譯工作流程嗎?不會完全取代。Yolanda 跟 Marcus 都強調儘管 AI 開啟了許多新的可能性,尤其是那些要求速度的大規模專案,但人類專業能力仍是不可或缺的要素。
翻譯人員與本地化專業人員必須透過以下作為,來適應這個新的趨勢:
培養提示工程及工作流程自動化等方面的技能
精通術語管理及品牌調性
與 AI 合作,專注在價值更高的工作:語氣、客群投入程度和特定領域的內容
為 MT 和 LLM 生成的輸出,提供創意意見及品管
產業正逐漸轉往協作機器人模式 (cobotic),也就是人類與機器協力合作以達成最佳的結果。
整合非常重要。AI 譯後編修必須要能順暢無礙地融入內容管理系統 (CMS)、文件管理平台以及其他內容所在並茁壯的資料庫。自動整合功能可確保以高效率快速地完成內容更新與本地化間的作業。
術語管理亦同樣重要。正如 Marcus 的說明,如今隨著翻譯及譯後編修的成本下降,投入建置完善的詞彙表和品牌調性資產,將可大幅改善 AI 生成翻譯的接受度與正確性。
展望未來,隨著 LLM 持續改善,加上有更多精心篩檢的訓練資料可用,AI 譯後編修在本地化中將會越來越重要。然而,人類的創造力、對文本脈絡的理解以及持續的監督,也依然會佔有重要的一席之地,確保能在科技持續演進的同時,推動創新與維持高品質的翻譯。
這場線上研討會提供了許多深入見解,讓人更加了解自動譯後編修如何有助增進翻譯工作流程,進而得以彈性靈活地拓展全球內容的規模。以下是重點摘要:
AI 在譯後編修的表現很好,可以減少人類心力。
AI 譯後編修會運用大型語言模型,更快速地進行可彈性擴展規模的翻譯與本地化作業。
機器翻譯的持續使用加上有效的術語管理 (TM 及詞彙表),可提升品質與一致性。
人機迴圈機制仍舊非常重要,對專門領域的內容以及人力資源不足的語言更是如此。
您可以根據內容側寫設定,選擇不同的 AI 服務層級 (從完全不進行人工譯後編修到譯後編修所有內容)。
即使參與的人力較少,依然可以獲致可接受的品質層級。
AI 譯後編修開啟了新的可能性,可進一步拓展內容觸及範圍並降低成本。
我們深知正確性一直以來都是 MT 解決方案的一個挑戰,這也是為什麼在採用 AI 優先做法的同時,我們也會維持使用人機迴圈機制,來設定、控管跟執行機器的維護工作。
我們會運用 AI,來提升例如翻譯記憶庫 (TM) 和神經機器翻譯 (NMT) 等傳統工具所產出的翻譯輸出。
根據我們在 AI 譯後編修上的經驗來看,它確實可以滿足對規模擴展能力的需求並維持品質。儘管如此,還是有必要透過人類監督來監控與調整這個工具,確認其正確性並滿足特定的內容需求。
我們的 AI 譯後編修解決方案一開始會先針對來源內容進行初始評量,了解其整體脈絡。掌握這個脈絡後,便會接著執行編輯與驗證步驟,確保產出的翻譯符合內容的目標和/或側寫設定。
我們在設計 AI 譯後編修解決方案時納入了設定功能,讓使用者可以根據參與翻譯流程之語言專家及主題專家的意見回饋,來編輯與更新語言提示。
除此之外,Lionbridge 也提供其他 AI 解決方案,讓我們得以執行來源分析並製作報告,找出對來源內容的修改建議。這些解決方案還可以搭配我們的 AI 譯後編修解決方案,進一步最佳化內容策略。
我們的 AI 譯後編修解決方案可讓我們定義並找出最值得語言專業人員參與的地方。
利用 REACH 架構,我們會與客戶一同評估內容的需求並設定 AI 解決方案,進而最佳化翻譯的輸出。接著我們可以定義不同程度的人類參與,確保這些心力的層級符合內容的需求和專案設定。
處理因語言和地區而異的產業專有術語不是件容易的事,但可以透過幾種方式解決。
透過運用中繼資料,我們可以提供更廣泛的脈絡給 AI 工具,並指示 LLM 處理額外的要求,例如地區細微差異等,但前提是內容必須先妥善地標記與標示。Lionbridge 的資料服務可以提供相關支援,協助公司企業達成這個先決條件。
對於那些必須依行政地區或地區調整的術語,我們會使用 RAG 架構來處理。在進行 AI 譯後編修時,我們會為 LLM 建立指引,要它根據定義好的語言規則執行特定動作。
您也可以運用我們解決方案的設定功能,去參考外部資料做為補充範例,協助 LLM 生成更符合特定脈絡的內容。
由於這類型的內容往往會隨時間演變,因此也必須要維護與更新語言提示。所以我們在建置 AI 解決方案時,亦特別設計可透過人類監督來加以控管和篩檢。
可以,我們的 AI 譯後編修解決方案不受特定 LLM 所限制,亦沒有綁定任何特定的模型。它雖然是用 OpenAI GPT 的模型再加以校正,但我們可以跟客戶合作,改為運用客戶自己的 LLM 引擎。
這種情境屬於自訂設定,可能需要進行更多的評估/設定,以確認該 LLM 符合品質標準。
關於這類解決方案,建議您與我們的解決方案和語言技術團隊協力合作,了解相關的需求、目標和要求。
我們的 AI 譯後編修解決方案具備可設定的語言提示功能,可因應不斷變化的內容需求及法規要求。儘管我們提議採用 AI 優先的流程,但語言提示的控管與篩檢仍舊是交由計算語言專家、主題專家 (SME) 和語言專業人員等人類負責,由他們進行最佳化和校正。
那些未經訓練、聊天機器人式的常用 LLM 模型,往往難以處理語氣、內容和文化上的細微差異。我們的解決方案處理這個挑戰的方式,就是使用可設定的方法,提供 LLM 明確的指示,清楚定義風格、語氣和術語,以及跟原本內容脈絡相關的語言指引。透過可控管的語言參數和提示設定,我們便能運用 AI 譯後編修來增進翻譯流程。
我們的解決方案一開始會先利用提示讓 LLM 理解來源內容的脈絡。我們會使用這個脈絡來指引 LLM 的決策判斷與編修作業,並提供評估術語、編修模糊比對以及驗證翻譯句段的指示,進而確保 AI 能在定義的參數範圍內運作。這種做法也讓我們得以持續更新語言提示,萬一發生幻覺時,也能視需要調整與修正問題。
這些測試人員通常是計算語言專家或是具提示工程經驗的語言專家,負責設計、測試與更新我們 AI 譯後編修解決方案的參數。這些語言專家會驗證輸出並提供意見回饋,這些意見接著會用來調整和精進語言提示與參數。
想進一步探索 Lionbridge 之前深入探討過的 AI 相關主題線上研討會嗎?歡迎前往 Lionbridge 線上研討會網頁,參閱此處彙整的影音資料。
想發揮 AI 譯後編修的強大能力,滿足您在翻譯與本地化方面的需求嗎?Lionbridge 能協助您結合自動化、LLM 與人類專業能力,建置出敏捷且可拓展的工作流程。歡迎立即與 Lionbridge 聯絡,徹底改變您的內容交付流程,進而能以更快、更聰明且更具影響力的方式,觸及更多全球目標對象。
請注意:本篇重點摘要部落格文章是先以 Lionbridge Content Remix App 製作,再由人員加以調整精進。
充滿熱忱的我們很希望了解您的需求,並與您分享我們的創新作法如何能賦予您更多能力,進而暢行無阻地拓展全球觸及範疇。準備好探索更多可能性嗎?歡迎給我們機會協助您達成目標。