1. 公司简介
Allie Fritz, Lionbridge 口译总监

Lionbridge 之星:Allie Fritz

Lionbridge 口译总监

mobile-toggle

选择语言:

台上商务人士获得关于 LLM 性能的全新洞见,象征这一顿悟的是一盏点亮的手提灯。
台上商务人士获得关于 LLM 性能的全新洞见,象征这一顿悟的是一盏点亮的手提灯。

网络研讨会回顾:是否在翻译迷途中徘徊?

深度解析 LLM 性能,精准把控翻译质量

如果您正在开发内部大型语言模型 (LLM) 或人工智能 (AI) 解决方案,不妨积极投入使用...并且弄清楚它们最适合处理哪些类型的内容;我们会全程提供支持,助您充分了解自身解决方案可能产生的输出结果"

— Simone Lamont,全球解决方案副总裁

是否在翻译迷途中徘徊?随着大型语言模型 (LLM) 的快速发展,企业正在探索使用它们实现翻译自动化和规模化的新方法。但在实际应用中,许多企业却在 LLM 性能方面栽了跟头,而这恰恰是生成式 AI (GenAI) 项目成功落地,或是沦为高成本废弃实验的关键分水岭。

在我们的网络研讨会“是否在翻译迷途中徘徊?”中,Lionbridge 的全球解决方案副总裁 Simone Lamont 探讨了组织在运用 LLM 开展翻译项目时面临的核心挑战,以及如何攻克这些难题,产出优质多语言内容。

想要完整观看网络研讨会吗?点击下方按钮即可观看录像。

  • #life_sciences
  • #content_transformation
  • #generative-ai
  • #automotive
  • #industrial_manufacturing
  • #technology
  • #ai-training
  • #retail
  • #content_creation
  • #webinar
  • #consumer_packaged_goods
  • #ai
  • #blog_posts
  • #legal_services
  • #translation_localization
  • #travel_hospitality

全球各类组织纷纷启动 AI 项目,并将 LLM 整合到工作流程中。其成果固然令人期待,但失望的情绪也真实存在。

事实上,72% 的 AI 项目在产生价值之前就被放弃了。为何如此?翻译质量不达标、幻觉和误译频发,再加上内部团队缺乏为各目标语言定制 LLM 的专业能力,这些都是关键原因。

AI 解决方案的质量问题和现实难题是什么?

LLM 承诺速度和规模,但如果没有仔细设置,它们可能会引入损害利益相关者和品牌信誉的错误。

组织反馈的问题包括品牌名称翻译错误、数字和计量单位处理有误、术语使用不一致,尤其当内部训练 LLM 但缺乏规范的语言资产时,这类问题更为突出。

另一大挑战在于,有效的提示词工程需要投入大量时间,且对专业技能有较高要求。为中文、德语或法语等语言定制解决方案,既需要技术专长,也离不开语言学的专业知识,而许多团队恰恰在这两方面存在不足。即使 AI 驱动的翻译在小规模项目中表现良好,也难以轻松扩展到企业级工作流程中。

字母与数字方块交织成迷宫,象征着 LLM 性能的复杂性。

预训练 LLM 与机器翻译 (MT) 解决方案相比,翻译表现究竟孰强孰弱?

开箱即用型 ChatGPT — 或任何一款 LLM — 真能满足企业级翻译需求吗?Lionbridge Machine Translation Tracker 的基准测试表明,标准的预训练 LLM 在翻译上的表现通常不如传统机器翻译引擎和混合解决方案。微调和检索增强生成 (RAG) 可提高质量。不过,在将 AI 驱动的解决方案提供给您的组织之前,了解何时以及如何使用这些技术以及如何测试结果至关重要。

内容类型应如何决定翻译质量水平?

并非所有内容都需要同等水平的翻译质量。本网络研讨会强调了将工作流程与内容风险及业务需求相匹配的重要性。例如,营销新闻稿要求极高的准确性和品牌一致性,而快速更新的网站内容则可容忍轻微的不自然表达。

容错能力因内容类型而异:
  • 医院病床手册和起搏器手册对准确性的要求截然不同。

  • 对于医疗和法律文件,零错误是不可妥协的硬性要求。

  • 对于其他类型的内容,速度和成本方面的需求可能会超过对完美翻译的需求。

理解您的内容至关重要。Lionbridge 的 REACH 框架要求您从投资回报 (ROI)、受众参与度、目标受众和控制要求四个维度进行考量,从而为每种应用场景确定最合适的处理方式,以及所需的人工介入程度。内容仅用于信息参考?还是属于专业性强、受监管或高影响力的内容?这些问题将直接影响您的工作流程决策 — 从完全由 LLM 驱动、无需人工审核的翻译,到必须经过专家全面审校的严格流程。

定制和人工审核如何改善翻译工作流程?

定制很重要。我们的 AI 优先型平台 Lionbridge Aurora AI™ 利用翻译记忆库 (TM)、词汇表、动态提示词和 LLM 进行译后编辑。这种方法减少了人力,同时提高了翻译质量。您可以根据不同应用场景,定制专属的语调、风格和术语,即使是不太常见的语言也能实现。

Simone 强调了持续评估的重要性。Lionbridge 提供自动化评估服务,根据术语、准确性、风格、地域惯例及受众相关性等多个维度,精准分析翻译质量。这些记分卡可帮助组织识别其 AI 解决方案的优势和劣势,从而实现有针对性的优化提升。

计算机故障的视觉画面,说明了 LLM 在性能方面遇到的挑战。

如何评估并提升 LLM 性能?

您如何知道您的 AI 解决方案是否能够胜任这项任务?本次网络研讨会分享了评估 LLM 性能和翻译质量的实用步骤:

  • 首先评估您当前的工作流程。将 LLM 或机器翻译输出与人工翻译进行比较。

  • 利用 Lionbridge 自动化质量评估,精准识别术语、风格、准确性等方面的改进空间。

  • 将不同的内容类型映射到适当的 AI 工作流程,平衡成本、周转时间和可接受的错误率。

Lionbridge 的评估服务可帮助组织告别对 LLM 性能的盲目猜测。只需提交译文样本,团队即可获得一份综合记分卡及切实可行的见解。这些数据使企业能够自信地使用内部 LLM 来处理特定的低风险内容,并为高风险项目寻求专业支持。

网络研讨会的关键要点有哪些?

本次网络研讨会能够为您提供关键洞察,助您了解如何在 LLM 表现未达预期时尽可能提高其性能。以下是研讨会涉及的关键要点。

  • LLM 的性能在很大程度上取决于所采用的 LLM 翻译解决方案、相关语言资源以及定制化程度。

  • 并非所有内容都需要同等水平的翻译质量 — 应确保工作流程与内容所需实现的成果精准匹配,同时平衡成本、交付时间和风险。

  • 现成的 LLM 通常比经过微调或采用混合架构的解决方案表现更差。

  • 自定义提示、词汇表和翻译记忆库 (TM) 可提高翻译质量。

  • 对于高风险或受监管的内容,人工审查仍然至关重要。

  • 使用客观数据评估您的 AI 解决方案的优势和劣势,以做出明智的决策。

  • Lionbridge 提供自动评估,帮助组织评估其 LLM 翻译成果

想了解 Lionbridge 深入探讨过的其他与 AI 相关的网络研讨会主题吗?请访问 Lionbridge 网络研讨会页面,查看网络研讨会记录库。

联系我们

准备好实现稳定可靠的 LLM 性能,达成您所在组织所追求的翻译质量了吗?Lionbridge 可以帮助您评估、优化和定制您的项目,以实现 AI 方面的成功。立即与我们联系,踏上合作之旅。

注意:这篇回顾博客文章初稿由 Lionbridge Content Remix App 创作,之后由人工进行了润色。

linkedin sharing button

作者:
Janette Mandell

联系我们

请输入企业邮箱地址