Harness the Lionbridge Lainguage Cloud to support your end-to-end localization and content lifecycle

Lainguage Cloud™ Platform
Connectivity
Translation Community
Workflow Technology
Smairt Content™
Smairt MT™
Smairt Data™
Language Quality
Analytics

Our people are our pride, helping companies resonate with their customers for 20+ years. 

About Us
Key Facts
Leadership
Insights
News
Trust Center

 

SELECT LANGUAGE:

Horizonal lines of varying thickness on a black background

機器翻譯與重大錯誤

運用自動品質檢查保護公司,避免重大翻譯錯誤帶來的嚴重後果

翻譯絕非枝微末節的小事。正確的翻譯能讓您打破語言限制,有效地觸及目標市場中的客群。今日的企業日漸仰賴機器翻譯 (MT),運用這個技術將營運範疇拓展至新市場,並更快地為所有客群翻譯更多內容,但於此同時,不慎傳播重大翻譯錯誤的風險也隨之增加。

這些重大錯誤會嚴重危害您的業務,因此了解 MT 有哪些缺點,並避免這類錯誤出現在給客群的訊息中,就顯得十分重要。諸如 Lionbridge 等精明的 MT 供應商,可以在翻譯過程中執行自動品質檢查,一方面可偵測出重大錯誤,一方面也能保持 MT 作業速度並減少人工干預的需要。

機器翻譯可能產生的兩類主要錯誤

雖然 MT 能運用大量文本廣泛學習,加上實現神經機器翻譯 (NMT) 的神經網路出現,使得 MT 的可靠性與日俱增,但這類引擎仍舊很容易出錯。一般而言,機器翻譯主要可能產生兩種錯誤類型,而各個類型的嚴重程度也不盡相同。

一般錯誤:定義及重要性

一般 MT 錯誤是兩類錯誤中情節較輕的一種,是目標語言中跟內容語言特徵有關的錯誤。一般錯誤包括了文法、拼寫或標點符號錯誤。儘管母語人士通常會注意到這種錯誤的存在,但它們很少會為公司招致災難性的負面影響。

事實上,一個大規模的研究便發現,使用者對堪用品質的接受度其實頗高。

針對 29 個國家/地區共 8,709 名消費者所做的一項調查顯示:

  • 65% 的購物者傾向購買以在地語言提供內容的產品,即使內容有些錯誤也沒關係
  • 66% 的使用者會使用線上機器翻譯,協助他們評估以其他語言提供的產品
  • 40% 的消費者不會購買以其他語言呈現的產品

(資料來源:「Can’t Read, Won’t Buy – B2C」(看不懂的人不會買單 – B2C),CSA Research,2020 年 6 月)

其實,有時翻譯並不需要完美無瑕。在這些情況下,企業大可不必太過擔心偶爾出現的這類一般錯誤。

重大錯誤往往超出語言學範疇,是指引擎的輸出內容大幅偏離了原文訊息的意圖。這類錯誤導致的錯誤資訊或誤解,可能會為企業帶來聲譽、財務或法律上的影響,甚至對公共安全或公共衛生產生不良後果。

重大錯誤:定義及重要性

重大 MT 錯誤顧名思義,是指情節重大的錯誤。如果含有重大錯誤的翻譯內容不慎傳播出去,公司就可能面臨極其嚴重的後果。

這類錯誤往往比語言學上的錯誤來得嚴重,是指引擎的輸出內容沒有正確地傳達原文的意圖。這種偏離原文訊息意旨的錯誤,可能會散佈錯誤資訊、引起困擾與誤會,甚至可能導致衝突。

舉例來說,如果執法機關或衛生官員向大眾發佈的指令中含有 MT 造成的重大錯誤,這些錯誤可能會對公眾福祉造成負面影響,並使得機關單位失去公信力。而公司若不慎將含有重大錯誤的內容傳播出去,則可能會在聲譽、財務或法律上面臨極其嚴重的後果。

重大錯誤的發生原因

重大錯誤可以視為是 MT 引擎功能失常的結果,當引擎無法理解文本,例如一詞多義或是原文內有錯字時,就可能產生重大錯誤。如果沒有妥善訓練引擎,或是使用的詞彙表有問題,進而導致同樣的錯誤一再重複,也會產生重大錯誤。

機器翻譯的引擎儘管非常精密複雜,但並不完美,因此才可能會產生重大錯誤。畢竟機器無法像人類一樣依脈絡判斷。

在夜色中點亮城市的摩天大樓

重大錯誤最可能在什麼時候出現在您的內文中?

重大錯誤出現的脈絡情況不盡相同。在判斷什麼時候可能會出現重大錯誤時,必須特別留意三種主要類型:重要實體的誤譯、否定或相反的意思,以及機器翻譯幻覺。

重要實體的誤譯

重要實體的誤譯,是指專有名詞 (個人或組織)、重要數字或度量衡單位的翻譯錯誤。

在專有名詞的翻譯上,如果該名稱同時也是常用字詞,就很容易發生錯誤。某個西班牙政府機關網站上的專有名詞誤譯,就讓大眾見識到這樣的重大錯誤。在這個實際案例中,人們在部門官方網站上看到的不是主管的姓名 Dolores del Campo,而是這個名字的字面翻譯:「痛苦的原野」

在機器翻譯時,引擎可能會翻譯了貨幣單位,比如說將日圓翻譯為美元,但在翻譯對應的數值時卻沒有將匯率納入考量,因此而造成的重大錯誤,可能會引發困惑並導致有害的經濟後果。

度量衡單位的翻譯也可能造成嚴重的問題。如果某個醫療文件中是以毫克說明劑量,但引擎錯誤地將劑量翻譯成公克,那麼閱讀翻譯文本的病患就可能使用錯誤的劑量,因而蒙受不良的醫療後果。而公司也可能必須為錯誤負責,並承受訴訟費用與相關損失。

否定和相反的意思

否定與相反意思的重大錯誤,是指目標語言中的錯誤會導致意思與原文的意圖相反。

舉例來說,假設某公司給股東的備忘錄從英文翻譯至西班牙文時,西班牙譯文中說股價下跌,但實際上股價卻是上漲的,這就是意思相反的重大錯誤。

機器翻譯幻覺

在很罕見的情況下,MT 可能會置入原文中根本不存在的內容,這就是所謂的機器翻譯幻覺 (hallucination)。發生這種類型的重大錯誤,代表 MT 引擎的軟體本身有問題。引擎可能會在特定情況下,生成冒犯、粗俗、挑釁或極為敏感的字詞。

陰暗隧道中有一串串彷彿朝向明亮出口奔去的橘色亮點

自動化方法如何有助防範機器翻譯作業所產生的重大錯誤?

設法阻止重大錯誤危及您的內容十分重要,但這並不是個簡單的任務。隨著電腦科學家持續不斷改善現有 MT 技術來阻止這些錯誤的發生,公司受重大錯誤威脅的風險也會因此減少。但在此之前,我們可以在翻譯流程中運用自動化技術,辨別可能的問題、修正有問題的字句並增進正確度。

Lionbridge 可以透過 Smairt MT™ 服務搭配先進的 Smairt Content 語言人工智慧 (AI) 技術,對翻譯文本進行特定的自動品質檢查,一方面偵測可能的錯誤,一方面保持 MT 作業速度並將由翻譯人員進行譯後編修的需求降至最低。

這些自動化方法可以偵測以下事項:

  • 辨識來源文字中的既是實體名稱也是常用字詞的實體,找出包括個人或組織名稱的專有名詞翻譯錯誤
  • 運用監督式機器學習 (ML) 演算法搭配冒犯詞語列表,偵測冒犯、粗俗或極為敏感的字詞
  • 辨識只出現於原文或譯文中而非兩者兼有的否定助詞 (亦即英文中「not」或其縮寫「n’t」或是中文中「非」、「沒有」等否定助詞的句子),藉此偵測譯文與原文意思相反的情形
  • 運用字典或冒犯字詞列表,找出譯文中會冒犯他人的機器翻譯幻覺 

自動品質檢查無法保證能完全清除重大錯誤。人們常常以為自動檢查後就沒有錯誤,但仍有一些錯誤可能會沒檢查到。儘管如此,這還是非常有效的作法,有助我們找出問題。採用這種方式,我們便能請專業譯者專注處理那些標記有問題的句子,避免重做整份文件。透過提醒專業譯者哪些地方最容易找到錯誤,我們也就能提高本地化流程的效率。

與我們聯絡

若想深入了解 Lionbridge 如何能協助您實行成功的 MT 策略,保護貴公司免於受重大錯誤所害,歡迎立即與我們聯絡

linkedin sharing button

Luis Javier Santiago 與 Janette Mandell
作者
Luis Javier Santiago 與 Janette Mandell
  • #blog_posts
  • #translation_localization