员工是我们引以为傲的资本,支撑着公司在 20 多年的时间里始终提供客户满意的服务。 

关于我们
领导层
见解
新闻
见解
关键事实

我们的专家了解您所在行业的来龙去脉以及所面临的挑战。

生命科学
银行与金融
零售业
电子商
Lionbridge Games
汽车
包装消费品
技术
制造业
法律服务
旅游和酒店业

利用 Lionbridge Lainguage Cloud 支持您的端到端本地化和内容生命周期

Lainguage Cloud™ Platform
轻松连接
翻译团队
工作流程技术
Smairt Content™
Smairt MT™
Smairt Data™

选择语言:

Lionbridge Machine Translation Tracker

为您介绍我们的评估工具,帮助您选择符合自身需求的理想机器翻译引擎

背景介绍

机器翻译 (MT) 已问世多年,但近年来的发展势头尤为迅猛。公司生成的多语言内容日益增多,为了在日趋全球化的世界中触及更多受众,他们逐渐将机器翻译视为一种颇具前景的方式。 

希望部署机器翻译的公司需要了解以下四种基本策略: 

公共 MT

使用 Google 或 Bing Translate 等服务。这些服务面向所有人免费开放且易于使用,但不具备术语定制等高级功能,并且数据可能会被用于其他服务。 

本地 MT

应用此方法的前提是公司在其 IT 环境中部署机器翻译服务器。这一方法安全性高,但价格昂贵、难于部署和管理且需要持续维护。

云 MT

这一方法与公共 MT 的工作原理类似。它托管在云中,但可以创建公司专属实例。分享至该服务的所有数据均受到严格保护,不会与第三方共享。该服务提供附加功能,例如术语定制和其他优势功能,但会导致公司只能依赖固定的一家供应商,而且对于有些语言间的互译,机器翻译质量也较低。 

优选 MT

这是一个可以管理多个机器翻译引擎的平台,可以定制一套术语,界面易于管理,且能够针对具体的一对语言和内容类型选出合适的引擎。

无论公司选择何种策略,如果没有合适的数据且不具备相关经验,那么就很难选出理想引擎。Lionbridge 在机器翻译领域深耕 20 余年,经验丰富,且汇集了有关机器翻译的海量语言和质量数据,可帮助客户做出正确选择。此网页提供了一些基本信息,可让您了解机器翻译引擎在处理常见语言对时的表现,帮助公司根据自己的内容做出合理选择。 

哪个机器翻译 (MT) 引擎效果更好? 要回答这个问题并不容易。


面对市面上的各种 MT 引擎,您在选择时需要注意一点:一些引擎只用于某特定用途或只针对某特定领域。 如果您的需求与引擎用途不匹配,那么无论该引擎多么先进,翻译效果可能都会不尽人意。 因此,要确定适合自己的理想选择,您首先要明确自己使用 MT 的目的。

如果只是用于一般用途,那么 Google Translate 或 Bing Translator 或许就挺合适。 但如果您需要针对某个特定语言或领域的 MT 引擎,Amazon Translate 或 DeepL Translator 可能更加适合您。

Lionbridge 的 Machine Translation Tracker 每月会分析各种引擎的性能,帮助您根据需要的语言对甄选出理想的 MT 引擎。 以后想要了解哪个 MT 引擎更好时,不妨换一种问法:“哪个 MT 引擎更能满足我的需求?”而且记住,您可以放心参考 Lionbridge 提供的实用信息。

想要进一步了解不同类型的机器翻译技术?请阅读我们的博客文章《了解机器翻译》

Lionbridge 专家评论

2023 年 2 月

通用机器翻译 (MT) 引擎往往可以为寻求翻译自动化的公司提供合格的译文。 但是,这些引擎提供的建议译文可能质量欠佳,在处理技术性内容或专业性很强的内容时则尤为如此。

想要改善机器翻译 (MT) 结果以达到特定目标的公司可以考虑两种选项: MT 定制和/或 MT 训练。 在自动翻译流程中运用其中一种方法或结合使用两种方法,可以获得更优质的译文。

但是,两种方法彼此不同,并且不可互相替代。 表 1 概述了 MT 定制和 MT 训练,以及在评估两种方法时需要考虑的因素。

机器翻译定制与机器翻译训练

  MT 定制 MT 训练
概念和工作原理 利用词汇表和保留不译 (DNT) 清单对已有的机器翻译引擎进行调整,以提高机器生成的译文的准确性 通过使用来自语料库和翻译记忆库 (TM) 的大量双语数据来构建和训练 MT 引擎,以提高机器生成译文的准确性
用途 提高 MT 建议的质量,让译文更准确并减少后期编辑工作 提高 MT 建议的质量,让译文更准确并减少后期编辑工作
具体优势 让公司能够遵循其品牌名称和术语,并实现地区化差异 让公司能够获得特定的品牌形象、语气和风格,并实现地区化差异
使用风险 执行不当时,MT 可能会提出糟糕的建议,并对整体质量产生负面影响 如果没有足够多的优质数据来训练引擎,MT 训练可能无法影响译文结果;如果经验不足的作者过度使用术语,MT 可能会生成糟糕的建议并对整体质量产生负面影响
适用情形 适合侧重技术和细节的内容以及任何有以下要求的内容:
*准确翻译术语
*体现地区化差异,但您缺乏充足的数据进行 MT 训练
适合专业性很强的内容、营销和创意内容,以及任何有以下要求的内容:
*呈现特定品牌形象、语气或风格
*体现地区差异,并且您有足够多的数据进行 MT 训练
成功因素 经验丰富的 MT 专家,能够妥善管理输入和输出规范化规则、词汇表和 DNT 至少 1.5 万个独特句段以充分训练引擎
成本考虑因素 更新 MT 引擎配置文件的一次性成本,以及随着时间推移维护词汇表产生的一些持续成本;考虑到潜在优势,成本相对便宜,并且通常低于 MT 训练成本 初次训练成本,如果监测 MT 性能后表明存在提升空间,可能随着时间推移需要考虑投入额外训练成本;考虑到潜在优势,在某些情况下,值得投资 MT 训练

表 1. MT 定制与 MT 训练对比

阅读我们的博客,详细了解机器翻译定制和机器翻译训练

 

    — Lionbridge MT 业务分析师 Thomas McCarthy

2023 年 1 月

大型语言模型 (LLM) 会取代神经网络机器翻译 (NMT),成为机器翻译 (MT) 的理想范式吗? 为了找出答案,我们将 OpenAI LLM GPT-3 系列的新版本 ChatGPT 和我们目前进行 MT 质量追踪的五个主要 MT 引擎的翻译表现进行了对比。

不出所料,专业 NMT 引擎的翻译表现比 ChatGPT 更好。 但令人惊讶的是,ChatGPT 交出的答卷同样让人惊叹。 如图 1 所示,ChatGPT 的表现几乎可以媲美专业引擎。

我们使用英语-西班牙语语言对的多份参照译文,根据编辑距离倒数算出了 MT 质量水平。 编辑距离指的是人工译员为确保编辑后的译文能达到人工翻译质量而必须做出的改动数量。 为了评估效果,我们将未经编辑的 MT 译文与 10 份不同的人工翻译(多份参照译文)进行对比。 编辑距离倒数值越高,翻译质量就越好。

图 1. 使用英语-西班牙语语言对的多份参照译文,根据编辑距离倒数比较 ChatGPT 和主流机器翻译引擎自动化翻译的质量。

因为该通用模型只接受过执行自然语言处理 (NLP) 的训练,并没有专门针对翻译任务进行过训练,所以它能取得这样的翻译表现是值得赞扬的。 ChatGPT 的表现大概能够达到 MT 引擎两三年前的译文质量水平。

公众对 LLM 大加关注,科技公司也对这项技术进行重大投资,这促进了 LLM 的演化。鉴于此,我们可能很快就会知道 ChatGPT 是否会取代 MT 引擎,或 MT 是否会开始采用新范式 — 大型语言模型。 MT 可能会将 LLM 作为基础,然后根据机器翻译的特别要求对这项技术进行微调。 这与 OpenAI 和其他大型语言模型公司的做法类似,这些公司会针对特定使用情形(比如令机器有可能以对话方式与人类交流)完善其通用模型。 专业训练可以让机器更准确地完成特定任务。

这些大型语言“通用”模型有一项优势:它们能完成许多不同的任务,并且大多数任务执行得非常不错。 举例来说,另一种通用智能模型 DeepMind GATO 已经针对 600 多种任务进行了测试,并且在完成其中 400 种任务时取得了“目前最佳水平”(SOTA) 结果。

两条发展线路会继续存在 — 一条是通用模型,比如 GPT、Megatron 和 GATO;另一条是基于这些通用模型,为达到特定目的而打造的专业模型。 通用模型对于促进通用人工智能 (AGI) 有重要意义。长期来说,这类模型甚至可能会推动影响更加深远的技术进步。 而专业模型在短期内则将实际用于特定领域。 关于 LLM,有一点值得一提 — 这两条线路可以齐头并进。

未来浪潮涌动之处,就是我们心之向往之地。 我们会持续评估 LLM 并公布结果,以便您能及时了解这场激动人心的演化之旅的新动向。 访问我们的博客,深入了解 ChatGPT 的翻译表现ChatGPT 和本地化以及为什么 ChatGPT 是一项颠覆性技术。

 

    — Rafa Moral,Lionbridge 创新副总裁

单击此处阅读以往的专家评论。

MT 整体质量评估
MT 引擎比较
时间
针对不同语言对的质量表现
从下拉菜单中选择德语、俄语、西班牙语或中文
时间
针对不同领域的质量表现
在下拉菜单中选择领域/主题
时间

如需了解有关机器翻译的更多见解和未来趋势,请阅读我们的“语言技术的未来”系列博客文章 —
《机器翻译的未来》

Lionbridge Machine Translation Tracker 工作原理

Lionbridge 将编辑改动程度作为评分方式。编辑改动程度可以衡量机器翻译和人工翻译之间的差距,具体方法为,计算译后编辑人员所更改的字符(亚洲语言)或单词(西方语言)的数量,然后用它来衡量机器翻译质量。指标越高,翻译质量越好。

在我们评估的四种机器翻译引擎中,Google 和 Bing NMT 处理多种语言对的常规内容时表现较好。但对于某些语言对,更专业的引擎表现更出众:DeepL 在翻译德语时表现最佳,Amazon 更善于翻译中文。

免责声明

  1. 此报告中的机器翻译引擎由 Lionbridge 每月进行评估。
  2. 报告提供的数据用于解释用途,具体案例应具体对待并分别进行评估。
  3. 此报告所用源数据由 Lionbridge 机器翻译团队预先选出。每次向各机器翻译引擎和各语言对提交相同的源数据,以便比较不同翻译引擎。
  4. 此报告生成过程中未使用任何客户数据。

更智能的 Smaⁱrter™ MT

Smaⁱrt MT™:机器翻译技术,帮助企业面向数字时代

统计机器翻译 (SMT) 和神经机器翻译 (NMT) 是常见的机器翻译类型。访问 Lionbridge 机器翻译中心了解关于这两种机器翻译技术的更多信息!

语言技术的未来:机器翻译的未来

机器翻译将进一步发展,如果部署得当,对提升翻译效率将变得越来越重要。

纯机器翻译与机器翻译加后期编辑

什么情况下更适合使用机器翻译?什么情况下应该考虑使用包含传统人工翻译的混合模式?我们来看看适用的场景。 

神经网络机器翻译:人工智能在语言翻译中的作用

深入探讨什么是神经网络机器翻译,以及为什么它能为语言行业带来颠覆性影响。

翻译及本地化:了解机器翻译,辨析相关术语

这份实用的文档将帮助您快速了解一些与机器翻译相关的重要术语。 

单击下图了解有关机器翻译的重要定义。

联系我们