LANGUAGE:
LANGUAGE:
Our people are our pride, helping companies resonate with their customers for 20+ years.
We create, transform, test, and train more content than anyone in the world – from text, voice, audio, video, to structured & unstructured data.
Solutions
Our experts know the in-and-outs of your industry & its challenges.
Harness the Lionbridge Lainguage Cloud to support your end-to-end localization and content lifecycle
Our people are our pride, helping companies resonate with their customers for 20+ years.
About Us
Key Facts
Leadership
Insights
News
Trust Center
We create, transform, test, and train more content than anyone in the world – from text, voice, audio, video, to structured & unstructured data.
Content Services
Technical Writing
Training & eLearning
Financial Reports
Multicultural Marketing
Digital Experience Assessments
Translation Services
Translation
Video Localization
Software Localization
Website Localization
Translation for Regulated Companies
Interpretation
Multilingual SEO & Digital Marketing
Content Optimization
Testing Services
Functional QA & Testing
Compatibility Testing
Interoperability Testing
Performance Testing
Accessibility Testing
UX/CX Testing
Solutions
Digital Marketing
Live Events
Machine Translation
Our Knowledge Hubs
Future of Localization
Innovation to Immunity
COVID-19 Resource Center
Disruption Series
Patient Engagement
Lionbridge Insights
Our experts know the in-and-outs of your industry & its challenges.
Life Sciences
Banking & Finance
Retail
E-Commerce
Games
Automotive
Consumer Packaged Goods
Technology
Industrial Manufacturing
Legal Services
Travel & Hospitality
Harness the Lionbridge Lainguage Cloud to support your end-to-end localization and content lifecycle
Lainguage Cloud™ Platform
Connectivity
Translation Community
Workflow Technology
Smairt Content™
Smairt MT™
Smairt Data™
Language Quality
Analytics
SELECT LANGUAGE:
大型科技公司看重機器翻譯 (MT) 的程度有多高? 為能自同業中脫穎而出,這些公司正採取哪些行動? 不區分特定月份或語言的情況下,哪一個引擎的表現最好? 這些正是 Lionbridge MT 專家每個月準備回答的問題。 讓您自己具備相關知識,以利進行明智的 MT 投資。
2022 年 10 月 — MT 和語言正式度
2022 年 9 月 — 運用術語提升 MT 輸出的品質
2022 年 8 月 — 克服 MT 作業產生的嚴重錯誤
2022 年 7 月 — MT 語言排名
2022 年 6 月 — 正確分析 MT 品質
2022 年 5 月 — Amazon 與 Yandex 的 5 月表現
2022 年 4 月 — Yandex 的 4 月表現
2022 年 3 月 — 客製化 MT 比較評估
2022 年 2 月 — 神經機器翻譯 (NMT) 的未來
2022 年 1 月 — MT 引擎 1 月表現
2021 年 12 月 — Lionbridge 在 MT 品質追蹤工具中新增 Yandex MT,以進行競爭力評比
2021 年 11 月 — Bing 翻譯工具有所改良
2021 年 10 月 — Amazon 的 MT 引擎如何不斷進步
2021 年 9 月 — Amazon 對 MT 品質進行改善
2021 年 8 月 — 龍頭科技公司及其 MT 引擎發展
這個月,我們想帶領您了解語言的正式度 (Formality),以及在使用機器翻譯 (MT) 時妥善處理這類問題的困難度有多大 (然而使用 MT 處理並非不可能)。
使用機器翻譯 (MT) 引擎時,您可能會在語言正式度這方面得到錯誤且不一致的結果。 理由何在? 一般而言,MT 模型會為輸入的每個分段文句傳回一個翻譯。 但若是輸入的分段文句有岐義時,模型就必須在數個有效選項中擇一輸出,而不會考量目標對象是誰。 而任由模型在不同的有效選項中選擇,就可能會造成翻譯不一致,或是翻譯的正式度有誤。
如果來源語言的正式度級別較目標語言來得少,就更難以得到正確的輸出成果。 舉例來說,有些語言具有明確定義的敬稱,例如法文的 tu (你) 或 vous (您),但英文則沒有。
雖然多數的 MT 系統並不支援語言正式度或性別參數,但我們仍舊看到一些進展。 目前,DeepL (API) 和 Amazon (主控台及 SDK) 均提供可調整正式度的功能。 而 Lionbridge 的企業級機器翻譯解決方案 Smairt MT™,則可以設定語言規則並套用至目標文本,以便依照所需的風格或正式度生成機器翻譯結果。
為了滿足您目標對象的需求,您必須有效地翻譯原文,而這也包括要解決 MT 輸出中正式或非正式用語的問題。 畢竟那些讓人感覺「不太對勁」或甚至無禮的翻譯,可能會讓目標對象對您敬而遠之。
歡迎閱讀我們的部落格文章,深入了解 MT 以及正式與非正式用語。
—Lionbridge MT 專員 Yolanda Martin
使用機器翻譯 (MT) 儘管有許多優點,但也必須審慎進行。 常見 MT 引擎輸出的翻譯有時會有不少錯誤,尤其是應用在特定領域上時,在術語方面可能會產生不如人意的結果, 如果是醫療或法律領域,更有可能因此造成嚴重的傷害。 但您可以透過一些方式來提升 MT 輸出的品質。
使用術語可以改善 MT 的品質,生成正確又一致的翻譯。
請務必使用含有特定領域專門術語的雙語文本,來訓練客製化的 MT 系統。 但是,如果在訓練引擎用的專門文本中,使用的術語並不一致,那麼也還是無法保證能產出正確的翻譯。 這個領域的相關研究建議,可以透過註解的方式將語言學資訊輸入神經機器翻譯 (NMT) 系統中。 至於要以人工還是半自動的方式實行註解,則取決於可用資源 (例如詞彙表) 以及限制條件 (例如時間、成本及可用註解人員等) 而定。
使用 Lionbridge 的 Smairt MT™,您不但可以設定語言規則並套用至來源與目標文字,也可以將「請勿翻譯」(DNT) 及詞彙表清單加入特定的設定檔,再據此進行術語管理。 我們會協助客戶建立與維護詞彙表,並定期調整以加入新的相關詞彙和汰除過時的術語。 此外,只要在 Smairt MT 建立詞彙表,就能將它們使用於所有的 MT 引擎,進一步節省時間與金錢。
在 MT 專案中使用詞彙表,並不像表面看來那麼簡單。 詞彙表如果使用不當,反而會對機器翻譯的整體品質造成負面影響。 如果希望 MT 生成的翻譯能使用所提供的術語,最好的作法就是透過 MT 訓練。 訓練 MT 引擎、客製化詞彙表,再加上制訂前處理及後處理的規則,將有助確保 MT 輸出使用正確的術語,並展現與客戶文件相近的風格。
歡迎閱讀我們的部落格文章,深入了解如何運用術語提升 MT 輸出的品質。
—Lionbridge MT 專員 Yolanda Martin
隨著公司日漸仰賴機器翻譯 (MT) 做為標準實務做法,員工也必須避免重大錯誤的傳播。
一般的 MT 錯誤是跟語言特徵有關的錯誤,例如拼寫、文法或標點符號等,然而重大錯誤比這類錯誤更加嚴重。 重大錯誤往往超出語言學範疇,是指引擎的輸出內容大幅偏離了原文訊息的意圖, 這類內容產生的錯誤資訊或誤解,可能會為企業帶來聲譽、財務或法律上的負面影響,甚至對公共安全或公共衛生產生不良後果。 因此,設法辨識並找出這類錯誤,阻止它們危及您的溝通,也就非常重要。
Lionbridge 會對翻譯文本特別執行自動品質檢查,一方面是為了偵測重大錯誤,一方面也能保持 MT 作業速度並減少人工干預的需要。
這些自動化方法可以偵測以下事項:
電腦科學家會持續不斷改善現有 MT 技術來避免這些翻譯錯誤,因此公司遇到重大錯誤的情形也會隨之減少。 但在此之前,我們可以在翻譯流程中運用自動化技術,辨別可能的問題、修正有問題的字句並增進正確度。
閱讀我們的部落格文章,進一步了解機器翻譯會產生的嚴重錯誤。
—MT 小組負責人 Luis Javier Santiago 和 Lionbridge 創新副總裁 Rafa Moral
Google NMT、Bing NMT、Amazon、DeepL、Yandex — 哪一種引擎最好? 從上個月的資料以及目前的一般趨勢來看,這些主流引擎的表現其實相差無幾。 正因如此,您在研發 MT 策略時更應該加入其他因素一起考量,例如哪一種 MT 引擎可更輕易翻譯特定的語言組合。
了解不同引擎處理特定語言組合的難易程度,您在規劃各個語言的翻譯費用時,就能更妥善地分配預算。舉例來說,處理複雜的語言組合時,您就需要分配更多資源與心力才能取得高品質翻譯。因此,對語言的複雜性有深入了解,會有助您做出更明智的商務決策。
依照可譯性來排序語言不是個簡單直覺的流程;然而,我們可以使用不同的指標來進行評估。編輯更動程度,也就是譯後編修人員為確保最終譯文擁有與人工翻譯相同的品質,而對機器翻譯之內容所做的更動次數,就有助於我們了解各個語言組合的 MT 複雜性和可譯性 (機器可譯性或 M 可譯性)。
當譯出語為英文時,多數羅曼語系的語言,例如葡萄牙文、西班牙文、法文和義大利文等,通常只要稍做修改就能得到高品質的譯文。我們發現這些目標語言是機器最能輕鬆處理的語言,它們也名列我們 M 可譯性排名的前四名。 匈牙利文和芬蘭文這兩個烏拉爾語系的語言,則屬於較為複雜的語言,因而在我們的可譯性排名中墊底,分別是第 27 和第 28 名。 另一個同一語系的愛沙尼亞文,也屬於較為複雜的語言。這些根據 Lionbridge 處理過的數百萬個句子分析所得的結果,可以看出語系對 MT 產出結果的重要性。
雖然同語言內的比較仍有其侷限,但這樣的排名能提供一些有趣的深入見解,協助您更有效地管理多語言專案。閱讀我們的部落格,查看完整的 Lionbridge 語言排名表。
—Lionbridge 創新副總裁 Rafa Moral
在 6 月,我們觀察到 Yandex MT 引擎的俄語翻譯有小幅進步,而 Microsoft Bing MT 引擎的翻譯成效則有些微退步。 這些是值得注意的改變,還是無關緊要的結果? 為進一步釐清,我們以不同方式分析了翻譯成效。
相較於使用單一嚴格標準來衡量 MT 翻譯和「完美」人工翻譯的差距,我們使用多種參考翻譯。 我們將每筆機器翻譯與 10 筆專業譯者的翻譯相互比較。 當我們採取這項做法時,Yandex 和 Microsoft Bing 在 6 月出現的翻譯品質小幅波動就不復存在。 有鑑於此,我們可以下個結論,就是 MT 翻譯品質並沒有改變; 6 月成效持平。
有時,資料以及根據資料繪製的圖表可能會有誤導之虞。 由於不同量測方法之間通常會有些許誤差,使得這類情況經常發生。 因此,使用一種以上的方法來評估資料,會是準確解讀成效的良好做法。
我們預期未來幾個月內,MT 引擎的品質將繼續持平。 我們將在此提供分析和對 MT 的整體觀察。 下個月,敬請期待對不同 MT 語言配對進行的比較。 我們將探討運用資料按 MT 複雜性來分類語言和語系的可行性,並判斷機器是否較為擅長翻譯某些語言配對。
—Lionbridge 創新副總裁 Rafa Moral
對 MT 引擎來說,大體而言,這又是波瀾不興的一個月。
我們注意到,Amazon 在處理英文譯至西班牙文這個組合上的表現有進步, 目前已成為這個語言組合表現最佳的引擎。 其實 Amazon 在其他語言上也有微幅進展,只是程度都沒有英文譯至西班牙文這個組合來得大。 我們推測這些進步是出於某些一般設定的變更,以及對英文譯至西班牙文這個組合所投入的心力。 這些改進似乎影響了某些特殊字元,與含有度量衡表示之字串的處理方式。
Yandex 連續兩個月出現微幅改善, 有趣的是,這些改善也影響到西班牙文。
如前所述,這個月並沒有什麼明顯的變化, 所有引擎的表現都相差無幾。 接下來的幾個月,我們將針對一些特定的 MT 領域進行分析,並提供整體而言觀察到的結果, 當然同時也會繼續追蹤重要的發展。
—Lionbridge 創新副總裁 Rafa Moral
Yandex 的 MT 引擎效能數個月以來都沒什麼變化,最近終於有了一些進步,在德文引擎上尤其明顯。
我們透過一項詳盡的分析,發現到 Yandex 引擎在處理含有標點符號字元 (例如問號、驚嘆號、引號和斜線號等) 及度量衡單位的句子上有進步。 這些改進可能是源自於 MT 設定上的細微調整,而非模型上的改善。 然而,我們在追蹤罕見詞彙時也看到了進步,所以也可能是模型的微調或是更多的資料訓練,使得 Yandex 有所改善。
去年此時,也有數個 MT 引擎展現了我們頗為關注的改善。 因此我們開始思考:這樣的進步是否有時間上的固定模式? 我們今年也會觀察到有如 2021 年的情形嗎? 我們會持續追蹤這些引擎的 MT 效能,並在下個月左右報告我們的發現。
總的來說,人們對 MT 引擎評估越來越感興趣。 時至今日,大多數的人都同意,MT 已是個成熟的技術。 無論是否採用人工干預還是混合作法,人們已經體認到這個技術對幾乎任何翻譯案例而言都很實用。 但該如何妥善地評估、衡量與改善 MT 結果,MT 使用者則仍在求取合適的評估方式。
—Lionbridge 創新副總裁 Rafa Moral
長期關注這個網頁的朋友,一定很熟悉我們對常見 MT 所做的比較評估報告。 每個月,我們都會說明特定語言組合表現最佳的 MT 引擎為何,並追蹤這些引擎的進展。 在 3 月,不同 MT 引擎的效能表現都持平。 這個趨勢已經持續了好一陣子, 正如我們上個月的評論,這可能代表我們需要一個新的 MT 典範。
在我們與大眾分享一般性評估結果的同時,也有越來越多的公司要求我們提供客製化 MT 比較評估。 與一般版本不同的是,這些評估會將公司的具體需求納入考量,來判斷哪些 MT 引擎對他們最為有利。
對於想開始使用 MT 或改善目前 MT 使用方式的公司來說,首要之務就是要找出最適合他們的 MT 引擎。 因此我們在進行客製化評估時,雖然採用的作法跟這個網頁所示的方式雷同,但會根據公司的內容類型跟語言組合要求來提出建議。
客製化 MT 比較評估的提供雖然已有數年之久,但對這類報告的需求卻是有增無減。 我們認為這是因為 MT 在協助企業成功立足數位市場之上,扮演了非常重要的角色。
—Lionbridge 創新副總裁 Rafa Moral
Google 的 MT 引擎在 2022 年 1 月及 2 月有小幅的進步,而我們關注的其他引擎,表現則停滯不前。 這項觀察結果使我們開始思考一些很尖銳的問題: 神經機器翻譯 (NMT) 這個典範是否已經達到頂點? 如果這些引擎無法再有長足的進展,我們是否需要改採新的做法? 畢竟在 NMT 取代統計式 MT 時,我們也觀察到類似的趨勢。
統計式 MT 時代落幕之際,MT 輸出品質幾乎可說沒什麼變化; 此外,不同 MT 引擎的輸出品質也漸趨相同。 現在我們也看到類似的走向。 儘管 NMT 還不會馬上被取代,但如果我們相信指數成長和加速回報理論,再將規則式 MT 為期 30 年和統計式 MT 盛行十數年的壽命納入考量,以 NMT 問世到目前進入第六年來看,或許不久之後就會出現新的典範轉移。
—Lionbridge 創新副總裁 Rafa Moral
在 1 月這段期間,主流機器翻譯 (MT) 引擎的效能表現並未出現大幅改變。
Google 在部分語言和領域上,表現有微幅改善。 其他多數引擎的效能都屬持平。 Microsoft 在過去幾個月有所改良,但其效能在 1 月未見提升。 整體而言,在一般用途的 MT 技術領域上,Google 的翻譯品質持續領先。
在 12 月,我們在追蹤工具中加入了第五個 MT 引擎。 透過監控 Yandex,我們可以更精準地分析俄語的 MT 品質。
—Lionbridge 創新副總裁 Rafa Moral
我們在 12 月時,在機器翻譯追蹤工具的品質比較中加入了新的成員:Yandex MT。
根據我們的測試集,Yandex 截至目前的表現如下:
另外我們也觀察到,MS Bing 在 2021 年最後幾個月的輸出改善令人激賞,譯入中文的進步尤其優異。 Amazon 也有不少改進。 邁入新的一年,則由 Google 率先在輸出結果上有所改善, 更明確地說,他們譯入西班牙文、俄文和德文的成績都有進步。 追蹤已達五週的 Yandex 表現曲線則持平,沒有多大變化。
—Lionbridge 創新副總裁 Rafa Moral
Microsoft 自然語言處理 (NLP) 的工程人員顯然抓到了訣竅,經過幾週的實驗,整體表現上下震盪後, Bing 翻譯工具的整體表現在過去幾週有所提升,中文方面更是有長足的進步,使得該 MT 引擎榮登上月表現最佳的寶座。 Bing 翻譯工具在大部分領域中的表現已經趕上部分競爭對手,甚至有超越這些對手表現的情形。 Bing 翻譯工具仍舊是訓練潛力數一數二優秀的引擎,而功能上的進步,也使得它會是您為內容建置專用客製化模型時不錯的選擇。
—Lionbridge 語言卓越能力團隊副總裁 Jordi Macias
10 月,Amazon 的機器學習 (MT) 引擎憑藉著之前一個多月來的成果不斷改善,持續與時俱進,締造了相當優秀的成果。根據我們觀察,這是 Amazon 過去幾個月內推出的第二波持續改善。
若您不太清楚 Amazon 過去的成績,在過去幾個月內,Amazon 的機器學習引擎在下面幾個領域中不斷改進:
—Lionbridge 語言卓越能力團隊副總裁 Jordi Macias
Amazon 的機器翻譯 (MT) 引擎在 9 月的表現可謂可圈可點。首先,Amazon 改善了他們德文與俄文的 MT 輸出品質;其次,他們在西班牙文與中文這個語言組合上的表現也有進步。這是過去幾個月內我們觀察到他們的第二波改善。
Amazon MT 引擎還有以下一些改變:
—Lionbridge MT 專員 Yolanda Martin
所有科技企業龍頭都已開發自己的 MT 引擎,其中包括 Microsoft、Google、Amazon、Facebook 以及最新加入這個行列的 Apple。而美國以外市場中的許多其他主要企業,也紛紛投入這個領域爭取領先。這些一流科技企業顯然都相信,MT 和自然語言處理 (NLP) 技術,對現今連結日趨緊密的全球化世界來說,是不可或缺的工具。
歡迎跟著 Lionbridge 一起,密切關注這個領域的競爭局勢。我們會根據公司的特殊需求、想要使用的語言組合與內容類型等因素,進行周密的全盤考量,找出最合適的 MT 引擎選擇。
隨著眾多一流科技企業投入心力開發 MT/NLP,相信這場競賽將更加激烈。隨著向來以注重細節和品質聞名的 Apple 加入這場戰局,也無疑會促使其他企業卯足全力求取進步。
—Lionbridge 創新副總裁 Rafa Moral