SELECT LANGUAGE:

機器翻譯詞彙解釋

對於想一窺究竟的門外漢來說,面對這些有時可以互相通用的詞彙,如何分辨箇中不同之處?您該如何解說機器翻譯相關詞彙?

機器翻譯詞彙解釋


經過將近 80 年的漫長發展,機器翻譯終於成了當紅炸子雞。

近年來,隨著 AI 觸角伸入這個時代的所有層面,「神經機器翻譯」(Neural MT) 也逐漸成為備受各個產業注意的熱門關鍵字之一。因此,不論您和機器翻譯 (MT) 的概念是否關係密切,都要對這個議題略知一二。

隨著人工智慧應用日益普及,公司和消費者接觸日多,浮上檯面的相關詞彙也越來越多。對於想一窺究竟的門外漢來說,面對這些有時可以互相通用的詞彙,如何分辨箇中不同之處?

您該如何解說機器翻譯相關詞彙?

我們能助您一臂之力。Lionbridge 在全球擁有一批經驗最豐富的 MT 專家。我們與這些專家合作,製作了這份速查表,協助您在遇到這些推動產業前進的詞彙時,能辨別箇中的微妙差異與明顯差異。

1. 人工智慧

想要了解 MT 的最新趨勢,首先得熟悉這項技術誕生與發展的背景:功能強大、讓人驚嘆的人工智慧 (AI)。AI 是指機器能在執行工作時展現「智慧」,也就是一般認為是人類本身具有的思維能力,例如學習或解決問題等。近年來,隨著電腦運算能力日漸強大,AI 也有了大幅進展。效能更加強大的電腦不但能在執行任務期間進行更密集的運算處理,也能展現更先進的「機器學習」能力,也就是可以透過執行工作獲得 AI 應用所需的知識。

2. 機器學習

機器學習是資訊科學的一個分支,是運用龐大的資料來教電腦執行某個任務。機器學習會檢查與某個特定任務相關的資料,從中找出模式並將資料連結在一起,接著運用這些新學到的知識,規劃電腦應該如何執行這項任務。如果經過這樣的分析後,電腦執行這個任務的表現有所「改善」,我們就會說機器學習到東西了。

由於目前幾乎任何事情都能找到相應的資料,因此人們也正運用機器學習來改善電腦在各個方面的效能,例如氣象預報、自動選股以及機器翻譯等。

Female standing holding a laptop

3. 機器翻譯

簡單地說,機器翻譯就是自動化的翻譯:將某個語言的來源資料輸入電腦,電腦便會以另一種語言輸出翻譯。這個技術並不完美,但若希望能更有效率地產出高品質翻譯,這會是最強大的工具之一。

過去數十年來,無論在輸出的品質還是支援的語言數目上,MT 的表現都越來越優異。從只能做簡單字詞代換的早期 MT 系統、根據文法和辭典明確編碼的規則式 MT、以大量數據分析模式的統計式 MT,一直到運用深度學習和類神經網路的神經 MT,機器翻譯一路走來的發展,可說亦步亦趨地反映了我們對電腦日漸精細複雜的使用。

4. 統計式機器翻譯

統計式機器翻譯 (Statistical Machine Translation,SMT) 是運用機器學習的原理,針對來源語句生成大量的候選翻譯,再根據目標語言中字詞與片語同時出現的機率,從大量的候選翻譯中挑選出最好的翻譯。SMT 是透過所謂的「N 連詞」(n-gram) 來學習翻譯,後者是指在來源與目標語言中會同時出現的一小組字詞。在 SMT 系統的機器學習階段,我們會將訓練材料輸入至系統:也就是非常、非常多的來源語言句子,以及這些句子在目標語言中的相應翻譯。這時,學習演算法會把來源與目標語言的句子拆解為 N 連詞,然後找出當來源語言中特定的 N 連詞出現在句子中時,目標語言的翻譯中通常會出現哪些 N 連詞。

接著,學習演算法會建立語言模型,計算特定詞彙與片語在目標語言中比鄰出現的機率。完成這個學習階段後,就是實兵演練、翻譯新素材的時候;SMT 系統會將新的來源句子拆解成 N 連詞、找出高度相關的目標語言 N 連詞,然後開始生成候選句。最後選定的翻譯,則會是目標語言 N 連詞與來源語言 N 連詞相關程度最高,同時其目標語言字詞在目標語言中同時出現機率最大的句子。

儘管 SMT 系統並沒有將任何語言學的因子納入考量,但 SMT 的翻譯成果卻出奇地好;的確,這個系統考量的只是 N 連詞,而不是完整的句子。而這種方法,剛好與新興的另一種 MT 方法截然不同:神經機器翻譯。

5.神經機器翻譯

神經機器翻譯 (NMT) 克服了 SMT 最大的缺點:後者對 N 連詞分析的依賴。NMT 能賦予機器能力,就像 SMT 一樣,這個系統也要用大量的資料來訓練,但兩者之間有個關鍵的不同點:NMT 系統收到訓練資料後,會「自己」決定如何從這些資料盡可能地學習。

NMT 系統會為每個來源句子建立資訊向量,並根據詞彙前後的字詞,為每個詞彙建立關聯資訊。有些系統可以為每個字建立數百個訊息片段,因此能產生深度的準確性。透過深度學習,NMT 系統可以為每個字詞及來源句擷取到大量的資訊,然後再運用所謂的注意力模型 (Attention Model) 以及這些大量資料串流的分析,來精進之前所學習到的關鍵特徵,這對翻譯流程至關重要。最後所生成的翻譯在流暢度上有顯著的改善,這也代表電腦產出的翻譯開始越來越自然流利。

儘管 NMT 還是很年輕新穎的一種 MT 模式,但它將會徹底改變我們的產業。隨著可用的工具組日漸成熟,以及日後越來越多的技術改進,Lionbridge 也將持續提高 MT 的使用比例,以期加快整個生產流程的進行。

 

Lionbridge 能熟練地運用 MT。我們自 2002 年起便提供大量的 MT 及譯後編修服務,不但規模年年提高,品質更是年年提升。按一下這裡,了解我們如何運用嫻熟的 MT 能力,協助客戶獲致成功

歡迎與我們的團隊討論您的機器翻譯需求

  • #blog_posts
  • #translation_localization

Lionbridge
AUTHOR
Lionbridge