语言:
语言:
我们致力于创建、转换、测试和训练从文本、语音、音频、视频到结构化和非结构化数据的广泛内容,所处理的内容数量远超全球其他任何公司。
我们的专家了解您所在行业的来龙去脉以及所面临的挑战。
利用 Lionbridge Lainguage Cloud 支持您的端到端本地化和内容生命周期
我们致力于创建、转换、测试和训练从文本、语音、音频、视频到结构化和非结构化数据的广泛内容,所处理的内容数量远超全球其他任何公司。
内容创作服务
技术文献写作
培训和在线学习
财务报告
多元文化营销
翻译服务
视频转录、翻译与本地化
翻译与本地化
视频本地化
软件本地化
受监管内容翻译与本地化
口译
多语言 SEO 和数字营销
内容优化服务
网站本地化
测试服务
功能 QA 和测试
兼容性测试
互操作性测试
性能测试
辅助功能测试
UX / CX 测试
我们的知识中心
本地化的未来
将创新想法转化为免疫实践
新冠肺炎疫情资源中心
颠覆系列
患者配合度
Lionbridge 见解
利用 Lionbridge Lainguage Cloud 支持您的端到端本地化和内容生命周期
Lainguage Cloud™ Platform
轻松连接
翻译团队
工作流程技术
Smairt Content™
Smairt MT™
Smairt Data™
选择语言:
机器翻译 (MT) 已问世多年,但近年来的发展势头尤为迅猛。公司生成的多语言内容日益增多,为了在日趋全球化的世界中触及更多受众,他们逐渐将机器翻译视为一种颇具前景的方式。
希望部署机器翻译的公司需要了解以下四种基本策略:
无论公司选择何种策略,如果没有合适的数据且不具备相关经验,那么就很难选出理想引擎。Lionbridge 在机器翻译领域深耕 20 余年,经验丰富,且汇集了有关机器翻译的海量语言和质量数据,可帮助客户做出正确选择。此网页提供了一些基本信息,可让您了解机器翻译引擎在处理常见语言对时的表现,帮助公司根据自己的内容做出合理选择。
面对市面上的各种 MT 引擎,您在选择时需要注意一点:一些引擎只用于某特定用途或只针对某特定领域。 如果您的需求与引擎用途不匹配,那么无论该引擎多么先进,翻译效果可能都会不尽人意。 因此,要确定适合自己的理想选择,您首先要明确自己使用 MT 的目的。
如果只是用于一般用途,那么 Google Translate 或 Bing Translator 或许就挺合适。 但如果您需要针对某个特定语言或领域的 MT 引擎,Amazon Translate 或 DeepL Translator 可能更加适合您。
Lionbridge 的 Machine Translation Tracker 每月会分析各种引擎的性能,帮助您根据需要的语言对甄选出理想的 MT 引擎。 以后想要了解哪个 MT 引擎更好时,不妨换一种问法:“哪个 MT 引擎更能满足我的需求?”而且记住,您可以放心参考 Lionbridge 提供的实用信息。
通用机器翻译 (MT) 引擎往往可以为寻求翻译自动化的公司提供合格的译文。 但是,这些引擎提供的建议译文可能质量欠佳,在处理技术性内容或专业性很强的内容时则尤为如此。
想要改善机器翻译 (MT) 结果以达到特定目标的公司可以考虑两种选项: MT 定制和/或 MT 训练。 在自动翻译流程中运用其中一种方法或结合使用两种方法,可以获得更优质的译文。
但是,两种方法彼此不同,并且不可互相替代。 表 1 概述了 MT 定制和 MT 训练,以及在评估两种方法时需要考虑的因素。
MT 定制 | MT 训练 | |
---|---|---|
概念和工作原理 | 利用词汇表和保留不译 (DNT) 清单对已有的机器翻译引擎进行调整,以提高机器生成的译文的准确性 | 通过使用来自语料库和翻译记忆库 (TM) 的大量双语数据来构建和训练 MT 引擎,以提高机器生成译文的准确性 |
用途 | 提高 MT 建议的质量,让译文更准确并减少后期编辑工作 | 提高 MT 建议的质量,让译文更准确并减少后期编辑工作 |
具体优势 | 让公司能够遵循其品牌名称和术语,并实现地区化差异 | 让公司能够获得特定的品牌形象、语气和风格,并实现地区化差异 |
使用风险 | 执行不当时,MT 可能会提出糟糕的建议,并对整体质量产生负面影响 | 如果没有足够多的优质数据来训练引擎,MT 训练可能无法影响译文结果;如果经验不足的作者过度使用术语,MT 可能会生成糟糕的建议并对整体质量产生负面影响 |
适用情形 | 适合侧重技术和细节的内容以及任何有以下要求的内容: *准确翻译术语 *体现地区化差异,但您缺乏充足的数据进行 MT 训练 |
适合专业性很强的内容、营销和创意内容,以及任何有以下要求的内容: *呈现特定品牌形象、语气或风格 *体现地区差异,并且您有足够多的数据进行 MT 训练 |
成功因素 | 经验丰富的 MT 专家,能够妥善管理输入和输出规范化规则、词汇表和 DNT | 至少 1.5 万个独特句段以充分训练引擎 |
成本考虑因素 | 更新 MT 引擎配置文件的一次性成本,以及随着时间推移维护词汇表产生的一些持续成本;考虑到潜在优势,成本相对便宜,并且通常低于 MT 训练成本 | 初次训练成本,如果监测 MT 性能后表明存在提升空间,可能随着时间推移需要考虑投入额外训练成本;考虑到潜在优势,在某些情况下,值得投资 MT 训练 |
表 1. MT 定制与 MT 训练对比
阅读我们的博客,详细了解机器翻译定制和机器翻译训练。
— Lionbridge MT 业务分析师 Thomas McCarthy
大型语言模型 (LLM) 会取代神经网络机器翻译 (NMT),成为机器翻译 (MT) 的理想范式吗? 为了找出答案,我们将 OpenAI LLM GPT-3 系列的新版本 ChatGPT 和我们目前进行 MT 质量追踪的五个主要 MT 引擎的翻译表现进行了对比。
不出所料,专业 NMT 引擎的翻译表现比 ChatGPT 更好。 但令人惊讶的是,ChatGPT 交出的答卷同样让人惊叹。 如图 1 所示,ChatGPT 的表现几乎可以媲美专业引擎。
我们使用英语-西班牙语语言对的多份参照译文,根据编辑距离倒数算出了 MT 质量水平。 编辑距离指的是人工译员为确保编辑后的译文能达到人工翻译质量而必须做出的改动数量。 为了评估效果,我们将未经编辑的 MT 译文与 10 份不同的人工翻译(多份参照译文)进行对比。 编辑距离倒数值越高,翻译质量就越好。
因为该通用模型只接受过执行自然语言处理 (NLP) 的训练,并没有专门针对翻译任务进行过训练,所以它能取得这样的翻译表现是值得赞扬的。 ChatGPT 的表现大概能够达到 MT 引擎两三年前的译文质量水平。
公众对 LLM 大加关注,科技公司也对这项技术进行重大投资,这促进了 LLM 的演化。鉴于此,我们可能很快就会知道 ChatGPT 是否会取代 MT 引擎,或 MT 是否会开始采用新范式 — 大型语言模型。 MT 可能会将 LLM 作为基础,然后根据机器翻译的特别要求对这项技术进行微调。 这与 OpenAI 和其他大型语言模型公司的做法类似,这些公司会针对特定使用情形(比如令机器有可能以对话方式与人类交流)完善其通用模型。 专业训练可以让机器更准确地完成特定任务。
这些大型语言“通用”模型有一项优势:它们能完成许多不同的任务,并且大多数任务执行得非常不错。 举例来说,另一种通用智能模型 DeepMind GATO 已经针对 600 多种任务进行了测试,并且在完成其中 400 种任务时取得了“目前最佳水平”(SOTA) 结果。
两条发展线路会继续存在 — 一条是通用模型,比如 GPT、Megatron 和 GATO;另一条是基于这些通用模型,为达到特定目的而打造的专业模型。 通用模型对于促进通用人工智能 (AGI) 有重要意义。长期来说,这类模型甚至可能会推动影响更加深远的技术进步。 而专业模型在短期内则将实际用于特定领域。 关于 LLM,有一点值得一提 — 这两条线路可以齐头并进。
未来浪潮涌动之处,就是我们心之向往之地。 我们会持续评估 LLM 并公布结果,以便您能及时了解这场激动人心的演化之旅的新动向。 访问我们的博客,深入了解 ChatGPT 的翻译表现、ChatGPT 和本地化以及为什么 ChatGPT 是一项颠覆性技术。
— Rafa Moral,Lionbridge 创新副总裁
免责声明