1. Aurora AI™
橙色和紫色极光背景,叠加 Lionbridge Aurora AI Array 标志的图像,代表全新的客户界面。

人类专业知识结合强大 AI

Lionbridge Aurora AI™ 是一款全球 AI 内容平台,提升多语言内容创作,并通过相关且个性化的内容扩大受众。

mobile-toggle

选择语言:

Modern technology with bright lights

语言机器可翻译性排名助力提升 MT 效果

了解语言的机器翻译难易度,助推部署效果更上层楼

尽管生成式人工智能 (GenAI) 正蓬勃发展,但随着企业面临越来越大的压力,需要以更快速度翻译更多内容,机器翻译 (MT) 依然是应对这一挑战不可或缺的利器。

因此,为充分发挥 MT 效果,您需要考虑评估使用 MT 引擎翻译特定语言对的便利性,即语言的机器可翻译性。为便于比较不同语言,我们对英语到 28 种目标语言的机器可翻译性进行了排名,详见表 1。

为什么要评估各语言对的机器可翻译性?

了解了语言对的机器可翻译性,就可以明确哪些语言对在翻译时需要投入更多精力,从而有助于您在规划多语种翻译成本时合理分配预算。

了解语言复杂程度能够方便您做出业务决策:

  • 对于复杂语言,是否应投入更高的预算?
  • 如果企业在考虑如何更好地分配预算,是否应在商业和文化因素之外加上语言排名?
  • 如果一种文化可以接受质量较低的译文,而其语言的机器可翻译性排名也较低,企业是否应采用机器翻译?
Digital stream of information

如何计算机器可翻译性?

计算各语言的机器可翻译性的过程并不简单。各语言的难点不同,对于质量的标准也不尽相同。不过,我们仍可以使用一些指标进行评估。 

例如,编辑改动程度,也就是译后编辑人员为确保最终文本能达到人工翻译质量而做出的改动数量。这一指标通常被用来比较不同机器翻译引擎对同一种语言的翻译效果,但我们也可以用它来判断不同语言的复杂程度,帮助我们确定每个语言对的机器可翻译性。

Lionbridge 机器可翻译性研究结果:各语言排名如何?为何会有这样的排名?

Lionbridge 处理了数百万个句子后,得出了 28 种目标语言的机器可翻译性排名。 

研究结果表明,语言复杂程度与语系有关。 

罗曼语族

从英语译入大多数罗曼语族语言(例如葡萄牙语、西班牙语、法语、意大利语),MT 译文质量通常较好,不需要进行大量修改。我们认为这几种目标语言是机器最容易处理的语言,位列机器可翻译性排行榜前四。

值得注意的是,榜单中同属罗曼语族的罗马尼亚语,排名较为靠后,位列第十位。这一结果可能是因为下列原因:罗马尼亚语在罗曼语族中翻译量较少,因此用于训练 MT 引擎的双语训练语料库较小,另外,罗马尼亚语的语法比较复杂(罗马尼亚语的语法复杂性与拉丁语类似)。  

简体中文

简体中文与英语大相径庭,却位列榜单第五位,紧随前四种罗曼语族语言。我们认为简体中文之所以位列如此高位,是因为 MT 引擎在过去五年中不断针对此语言对进行更新和优化,我们在此期间对 MT 的持续跟踪结果也印证了这一点。由于英-中语言对的商业利益较高,因此 MT 公司对此大举投资,以改进 MT 效果。

较为复杂的语言

匈牙利语和芬兰语这两种乌拉尔语系语言则更为复杂,在我们的排名中位列末尾,分别排在第 27 位和第 28 位。同属乌尔拉语系的爱沙尼亚语位列榜单的第 24 位。 

韩语的排名也较靠后,位列第 25 位。

Person working on computer with analytical data

机器可翻译性的意义

虽然语言比较的结论尚不完善,但机器可翻译性排名以及语言复杂程度和语系之间的关联性还是提供了一些耐人寻味的见解,可以帮助您更好地管理多语言项目。

表 1

语言的机器可翻译性排名

排名 语言(从英语译入) 排名 语言(从英语译入) 排名 语言(从英语译入)
1 葡萄牙语 11 泰语 20 中文(繁体)
2 西班牙语 12 挪威语 21 立陶宛语
3 法语 13 德语 22 捷克语
4 意大利语 14 瑞典语 23 阿拉伯语
5 中文(简体) 15 土耳其语 24 爱沙尼亚语
6 荷兰语 16 斯洛伐克语 25 韩语
7 丹麦语 17 希伯来语 26 俄语
8 日语 18 拉脱维亚语 27 匈牙利语
9 希腊语 19 波兰语 28 芬兰语
10 罗马尼亚语        

表 1

语言的机器可翻译性排名

排名 语言(从英语译入)
1 葡萄牙语
2 西班牙语
3 法语
4 意大利语
5 中文(简体)
6 荷兰语
7 丹麦语
8 日语
9 希腊语
10 罗马尼亚语
11 泰语
12 挪威语
13 德语
14 瑞典语
15 土耳其语
16 斯洛伐克语
17 希伯来语
18 拉脱维亚语
19 波兰语
20 中文(繁体)
21 立陶宛语
22 捷克语
23 阿拉伯语
24 爱沙尼亚语
25 韩语
26 俄语
27 匈牙利语
28 芬兰语

联系我们

如需详细了解 Lionbridge 如何协助您将 MT 工具融入 AI 驱动的翻译工作流程,从而实现高效、优质的多语言沟通,欢迎立即联系我们

注意:此博客更新的博文最初发布于 2022 年。

linkedin sharing button
  • #technology
  • #blog_posts
  • #translation_localization

作者
Rafa Moral 和 Janette Mandell

微信扫码咨询

联系我们

Business Email Only