员工是我们引以为傲的资本,支撑着公司在 20 多年的时间里始终提供客户满意的服务。 

关于我们
关键事实
领导层
见解
新闻
信任中心

利用 Lionbridge Lainguage Cloud 支持您的端到端本地化和内容生命周期

Lainguage Cloud™ Platform
轻松连接
翻译团队
工作流程技术
Smairt Content™
Smairt MT™
Smairt Data™

选择语言:

Lionbridge Machine Translation Tracker

为您介绍我们的评估工具,帮助您选择符合自身需求的理想机器翻译引擎

背景介绍

机器翻译 (MT) 已问世多年,但近年来的发展势头尤为迅猛。公司生成的多语言内容日益增多,为了在日趋全球化的世界中触及更多受众,他们逐渐将机器翻译视为一种颇具前景的方式。 

希望部署机器翻译的公司需要了解以下四种基本策略: 

公共 MT

使用 Google 或 Bing Translate 等服务。这些服务面向所有人免费开放且易于使用,但不具备术语定制等高级功能,并且数据可能会被用于其他服务。 

本地 MT

应用此方法的前提是公司在其 IT 环境中部署机器翻译服务器。这一方法安全性高,但价格昂贵、难于部署和管理且需要持续维护。

云 MT

这一方法与公共 MT 的工作原理类似。它托管在云中,但可以创建公司专属实例。分享至该服务的所有数据均受到严格保护,不会与第三方共享。该服务提供附加功能,例如术语定制和其他优势功能,但会导致公司只能依赖固定的一家供应商,而且对于有些语言间的互译,机器翻译质量也较低。 

优选 MT

这是一个可以管理多个机器翻译引擎的平台,可以定制一套术语,界面易于管理,且能够针对具体的一对语言和内容类型选出合适的引擎。

无论公司选择何种策略,如果没有合适的数据且不具备相关经验,那么就很难选出理想引擎。Lionbridge 在机器翻译领域深耕 20 余年,经验丰富,且汇集了有关机器翻译的海量语言和质量数据,可帮助客户做出正确选择。此网页提供了一些基本信息,可让您了解机器翻译引擎在处理常见语言对时的表现,帮助公司根据自己的内容做出合理选择。 

哪个机器翻译 (MT) 引擎效果更好? 要回答这个问题并不容易。


面对市面上的各种 MT 引擎,您在选择时需要注意一点:一些引擎只用于某特定用途或只针对某特定领域。 如果您的需求与引擎用途不匹配,那么无论该引擎多么先进,翻译效果可能都会不尽人意。 因此,要确定适合自己的理想选择,您首先要明确自己使用 MT 的目的。

如果只是用于一般用途,那么 Google Translate 或 Bing Translator 或许就挺合适。 但如果您需要针对某个特定语言或领域的 MT 引擎,Amazon Translate 或 DeepL Translator 可能更加适合您。

Lionbridge 的 Machine Translation Tracker 每月会分析各种引擎的性能,帮助您根据需要的语言对甄选出理想的 MT 引擎。 以后想要了解哪个 MT 引擎更好时,不妨换一种问法:“哪个 MT 引擎更能满足我的需求?”而且记住,您可以放心参考 Lionbridge 提供的实用信息。

想要进一步了解不同类型的机器翻译技术?请阅读我们的博客文章《了解机器翻译》

Lionbridge 专家评论

2023 年 10 月

生成式人工智能 (GenAI)/大型语言模型 (LLM) 技术大行其道、前景可期,Lionbridge 的机器翻译 (MT) Quality Tracker 报告也因此进行了升级。 今后,该报告不仅会发布 GPT-3.5、Davinci 和神经网络 MT (NMT) 引擎的表现,还将为您介绍 GPT-4 的译文结果。

我们最新发现了 GPT-4 一些值得注意的特点。

我们发现 GPT-4 存在一些问题,比如性能缓慢,出于多种原因而无法提供译文,译文水平参差不齐(有时会漏译,有时又不会)。

最新发现 1 — GPT-4 无法翻译某些内容。

在我们的 MT 测试中,GPT-4 无法翻译某个句子。

调查之后我们发现,特定语境中的一个具有性暗示的词语导致了这个问题。 不过要声明一点,测试中的这个句子十分平常,绝无任何色情淫秽意味。 然而,这个词语还是触发了 GPT-4 的色情内容过滤机制,AI 在随后进行审核时删除了该句子的译文。 该结果十分出人意外,原因有二:

在正常情况下单独使用该词绝无问题。

这个句子的具体语境也绝不会引发色情方面的联想。

这一发现让我们得出一个结论:GPT-4 的部分过滤机制可能只是简单地基于一份禁用词列表,其中还包括模棱两可的词语。 这种方法问题很大,因为这很可能会矫枉过正,连正常内容都一并过滤掉,而这对于专业翻译来说后果十分严重。

由于早期的 MT 技术(比如神经网络 MT 引擎)不存在这种内容过滤问题,因此这一问题是 LLM 技术的缺陷。

这一缺陷将对实际应用造成影响。 例如,如果需要翻译妇科或性教育方面的医学内容, 而 LLM 不翻译其中的一些内容,则会让人倍感困扰。

有趣的是,只有将这一句子译为中文时才会出现问题,译为其他语言都无碍。 此结果表明,该过滤机制仅作用于 GPT-4 的输出内容, 只需关闭翻译任务的内容过滤器即可解决这一问题。

最新发现 2 — GPT-4 译文水平参差不齐。

我们在为期五周的测试后发现,LLM 的 MT 译文质量良莠不齐十分严重,尤其是 GPT-4。

尽管 GenAI 有此结果并不奇怪,但其严重性远超预期 — 我们甚至使用了“温度和最高概率 (Top_p)”参数设置来降低译文创造力,提升译文确定性。 GPT 对于同一篇测试稿的译文次次不一致,甚至在测试一遍之后紧接着立刻再翻译,译文都完全不同。

前后两篇译文尽管不同,但都算正确。 尽管如此,这一点也同样需要加以管控,并且从前的 NMT 范式不会出现此情况。

我们开始感到,MT 范式可能从 NMT 改换到 LLM,这不仅仅是技术层面的变革,同时也要求人们转变观念: 我们可能需要准备好面对不确定性更高的译文,即使是针对同一篇源文且采用相同的参数,其结果与我们当前所熟知的自动化技术相比也将更加多变。

尽管可以使用一些机制和优秀实践来控制这种多变性,但我们仍要在一定程度上对其习以为常。

最后,当您浏览我们的图表时请注意,尽管 GPT-4 的编辑距离下降了,但这并不表示质量也下降了。 这仅仅说明 GPT 译文差异很大。 下个月,我们可能会看到该数据有所上升。 该领域仍有很大的发展和解读空间。

 

    — Rafa Moral,Lionbridge 创新副总裁

单击此处阅读以往的专家评论。

MT 整体质量评估
MT 引擎比较
时间
针对不同语言对的质量表现
从下拉菜单中选择德语、俄语、西班牙语或中文
时间
针对不同领域的质量表现
在下拉菜单中选择领域/主题
时间

如需了解有关机器翻译的更多见解和未来趋势,请阅读我们的“语言技术的未来”系列博客文章 —
《机器翻译的未来》

Lionbridge Machine Translation Tracker 工作原理

Lionbridge 将编辑改动程度作为评分方式。编辑改动程度可以衡量机器翻译和人工翻译之间的差距,具体方法为,计算译后编辑人员所更改的字符(亚洲语言)或单词(西方语言)的数量,然后用它来衡量机器翻译质量。指标越高,翻译质量越好。

在我们评估的四种机器翻译引擎中,Google 和 Bing NMT 处理多种语言对的常规内容时表现较好。但对于某些语言对,更专业的引擎表现更出众:DeepL 在翻译德语时表现最佳,Amazon 更善于翻译中文。

免责声明

  1. 此报告中的机器翻译引擎由 Lionbridge 每月进行评估。
  2. 报告提供的数据用于解释用途,具体案例应具体对待并分别进行评估。
  3. 此报告所用源数据由 Lionbridge 机器翻译团队预先选出。每次向各机器翻译引擎和各语言对提交相同的源数据,以便比较不同翻译引擎。
  4. 此报告生成过程中未使用任何客户数据。

更智能的 Smaⁱrter™ MT

Smaⁱrt MT™:机器翻译技术,帮助企业面向数字时代

统计机器翻译 (SMT) 和神经机器翻译 (NMT) 是常见的机器翻译类型。访问 Lionbridge 机器翻译中心了解关于这两种机器翻译技术的更多信息!

语言技术的未来:机器翻译的未来

机器翻译将进一步发展,如果部署得当,对提升翻译效率将变得越来越重要。

纯机器翻译与机器翻译加后期编辑

什么情况下更适合使用机器翻译?什么情况下应该考虑使用包含传统人工翻译的混合模式?我们来看看适用的场景。 

神经网络机器翻译:人工智能在语言翻译中的作用

深入探讨什么是神经网络机器翻译,以及为什么它能为语言行业带来颠覆性影响。

翻译及本地化:了解机器翻译,辨析相关术语

这份实用的文档将帮助您快速了解一些与机器翻译相关的重要术语。 

单击下图了解有关机器翻译的重要定义。

联系我们