1. NOTRE ENTREPRISE
Allie Fritz, Directrice de l'interprétation chez Lionbridge

Portrait : Allie Fritz

Directrice de l'interprétation chez Lionbridge

mobile-toggle

SÉLECTIONNER LA LANGUE :

La post-édition par l'IA avec des LLM

Récapitulatif du webinaire : L'IA est-elle capable de post-éditer ?

Application pratique de la post-édition automatisée avec Cisco Networking Academy, et point de vue de Lionbridge

Vous avez du mal à répondre à la demande de contenu multilingue ? Vous n'êtes pas seul(e). Pendant de nombreuses années, les équipes de traduction ont été confrontées à des défis de taille : des budgets serrés, des ressources humaines limitées et une demande incessante de contenu. Et si vous étiez en mesure de fournir des traductions de haute qualité plus rapidement, à grande échelle et à un coût nettement inférieur ? Avec l'intelligence artificielle (IA), c'est désormais possible.

Lors du webinaire de Lionbridge, « L'IA est-elle capable de post-éditer ? », les experts de Lionbridge et de Cisco Systems explorent la manière dont la post-édition par l'IA transforme la traduction et la localisation.

La session, à laquelle participaient Marcus Casal, directeur de la technologie de Lionbridge, et Yolanda Cham Yuen, responsable du programme GTS chez Cisco Systems, a abordé une question centrale : l'IA peut-elle post-éditer à l'aide de grands modèles de langage (LLM) pour fournir des traductions précises, fiables et rentables à grande échelle ? La réponse est un oui retentissant, avec des réserves importantes.

L’IA est capable de post-éditer, et elle le fait très bien.

— Marcus Casal, directeur technique de Lionbridge

Vous souhaitez regarder le webinaire dans son intégralité ? Utilisez le bouton ci-dessous pour accéder à l'enregistrement.

Post-édition automatisée : comment est-elle devenue la nouvelle réalité ?

La post-édition par IA n'est plus une vision lointaine, elle est déjà là et contribue à transformer le monde réel.

La plateforme Lionbridge Aurora AI™ orchestre l'intégralité du cycle de vie du contenu international, depuis l'ingestion des données client jusqu'à leur restitution dans des référentiels de contenu, en passant par leur traduction automatique (TA), avec de grands modèles de langage (LLM) pour la post-édition automatisée.

Qu'est-ce qui permet cela ? Une combinaison d'automatisation pilotée par API, d'une plateforme d'intégration en tant que service (iPaaS) et de ressources linguistiques robustes, telles que la mémoire de traduction (TM), les glossaires et la gestion de la terminologie. En combinant la TA, une post-édition basée sur des grands modèles de langage (LLM) qui utilise des modèles de pointe, et des flux de travail intelligents, les organisations peuvent diffuser du contenu de manière plus rapide et prévisible.

Mais la vitesse et l’évolutivité ne suffisent pas. La qualité compte toujours. C'est pourquoi l'approche de Lionbridge intègre la supervision humaine (HITL, Human-in-the-Loop). Les humains entraînent et affinent les modèles, puis en évaluent les résultats si nécessaire, afin de garantir que le produit final répond à ses objectifs en matière de contenu.

Quelle a été l'application pratique de la post-édition automatisée de Cisco Networking Academy ?

Yolanda a décrit l'utilisation par Cisco de la post-édition automatisée pour son initiative mondiale de responsabilité sociale, Cisco Networking Academy.

Cisco Networking Academy propose une formation technologique gratuite en matière de réseau, de cybersécurité, de programmation et d'autres sujets liés à la science des données, touchant plus de 23 millions de participants dans 191 pays. La langue pouvant devenir une barrière redoutable, la localisation est essentielle afin de maximiser l’impact de ses cours.

Pour élargir l'accès et rendre les cours de la Network Academy accessibles dans le monde entier, Cisco avait besoin d'une solution évolutive pour traduire des millions de mots dans plus d'une dizaine de langues, souvent avec des délais et des budgets serrés.

Sa solution ? La mise en œuvre de la post-édition automatisée.

Représentation abstraite du mouvement dynamique avec code binaire, symbolisant la post-édition par l'IA.

En quoi consiste la solution de Cisco Network Academy ?

La solution de Cisco combine différents éléments :

  • Mémoires de traduction reprenant le contenu précédemment approuvé.

  • Traduction automatique neuronale (NMT) pour la traduction initiale en raison de sa rapidité, de son coût et de sa cohérence.

  • Post-édition par l'IA optimisée par des LLM pour affiner le contenu généré.

  • Testeurs humains pour une révision fonctionnelle en contexte, en particulier pour les langues complexes.

Quels résultats la Cisco Networking Academy a-t-elle obtenus ?

Les résultats ont été tout simplement remarquables.

L’utilisation de la post-édition automatisée a permis à Cisco Networking Academy de traduire plus de 15 millions de mots en 14 langues, soit 24 cours en seulement trois mois. Le goulot d'étranglement est passé de la traduction aux tests fonctionnels et à la mise en scène, ce qui a permis de gagner considérablement en efficacité. Tout ce travail a coûté moins de 70 000 $, un montant considérablement inférieur aux méthodologies traditionnelles.

En exploitant les LLM pour la post-édition, Cisco peut désormais publier du contenu dans plusieurs langues simultanément, réduisant ainsi considérablement le décalage entre la version anglaise et les versions localisées, et élargissant l'accès mondial à ses cours.

« Nous constatons désormais que le contenu est traduit à une vitesse et à un coût jamais vus auparavant. … La post-édition automatique ouvre la voie à de nouveaux espaces, à de nouvelles perspectives qui autrement ne seraient ni abordables ni réalisables dans les scénarios très difficiles auxquels nous sommes confrontés. »

— Yolanda Cham Yuen, Cisco Systems

Quelles sont les limites et les risques de la post-édition par l’IA ?

La post-édition par l’IA est puissante, mais pas parfaite. Les intervenants mettent en avant un certain nombre de limites :

  • Les langues pour lesquelles les ressources sont faibles présentent des défis plus importants, tant pour les personnes que pour les machines. Les LLM (y compris les modèles de pointe) sont plus performants en anglais et dans les langues fréquentes ; des glossaires spécialisés et des données d'entraînement sont essentiels pour les langues de niche.

  • Lorsque l'IA est utilisée seule, les nuances culturelles, le ton et l’expertise du domaine posent encore certains défis. Les flux d'invites et la supervision humaine sont primordiaux pour saisir les subtilités, que ce soit dans la terminologie sportive ou dans le langage technique.

  • Des hallucinations (lorsque l’IA génère des informations inexactes ou trompeuses) peuvent se produire, parfois de manière très convaincante. Cette limite souligne l’importance des tests fonctionnels et des retours directs des utilisateurs finaux comme garanties essentielles pour garantir un contenu à fort impact.

Marcus raconte une anecdote pratique : l'expression « protégez votre gazon » pour une annonce de chaussures de basket-ball sur un site de commerce électronique a été traduite en espagnol par « césped » (gazon artificiel ou pelouse), un terme adapté au football, mais pas au basket-ball. En affinant les glossaires et la terminologie, l’erreur a été corrigée, ce qui a amélioré la confiance des utilisateurs.

Comment l’intervention humaine améliore-t-elle la post-édition par l’IA ?

La post-édition par l’IA remplacera-t-elle les flux de traduction traditionnels ? Pas entièrement. Yolanda et Marcus insistent sur le fait que, même si l’IA ouvre de nouvelles possibilités, notamment pour les projets rapides et à grande échelle, l’expertise humaine reste indispensable.

Les traducteurs et les professionnels de la localisation doivent s’adapter en :

  • Développant des compétences en ingénierie des invites et en automatisation des flux de travail

  • Maîtrisant la gestion de la terminologie et la voix de la marque

  • Intégrant l'IA pour se concentrer sur des tâches à plus forte valeur ajoutée : ton, engagement du public et contenu spécifique au domaine

  • Fournissant du contenu créatif et une assurance qualité pour le contenu généré par la TA et les LLM

L’industrie évolue vers un modèle « cobotique », à savoir la robotique coopérative, où les humains et les machines travaillent ensemble pour obtenir des résultats optimaux.

Comment l’intégration et la gestion de la terminologie améliorent-elles les résultats ?

Le secret réside dans l'intégration. La post-édition par l’IA doit s’intégrer parfaitement aux systèmes de gestion de contenu (CMS), aux plateformes de gestion de documents et aux autres référentiels où le contenu vit et évolue. Les intégrations automatisées garantissent un aller-retour rapide et efficace pour les mises à jour et la localisation du contenu.

La gestion terminologique est tout autant importante. Comme l’explique Marcus, l'investissement dans des glossaires robustes et des ressources de marque, en particulier maintenant que les coûts de traduction et de post-édition sont plus bas, améliore considérablement l’acceptabilité et la précision des traductions générées par l’IA.

Quelle est la prochaine étape pour la post-édition par l’IA dans la traduction ?

À l’avenir, à mesure que les LLM continueront de s’améliorer et que des données d'entraînement mieux sélectionnées seront disponibles, la post-édition par l’IA prendra de plus en plus de place dans la localisation. Toutefois, la créativité humaine, la compréhension du contexte et la supervision continue resteront essentielles pour stimuler l’innovation et maintenir une qualité de traduction élevée à mesure que la technologie continue d’évoluer.

Quels sont les principaux points à retenir du webinaire ?

Ce webinaire offre différentes perspectives sur la post-édition automatisée pour des flux de traduction améliorés, permettant la production de contenu mondial à grande échelle. En voici les points clés :

  • L’IA peut assurer une post-édition efficace et réduire l'intervention humaine.

  • La post-édition par l'IA s'appuie sur de grands modèles de langage pour fournir une traduction et une localisation plus rapides et évolutives.

  • L’utilisation continue de la traduction automatique et d’une gestion terminologique efficace (TM et glossaires) améliore la qualité et la cohérence.

  • L’implication humaine reste essentielle, en particulier pour le contenu spécialisé et les langues à faibles ressources.

  • Différents niveaux de service pilotés par l'IA, allant de l'absence de post-édition humaine à la post-édition de tout le contenu, peuvent être appliqués en fonction de vos profils de contenu.

  • Des niveaux de qualité acceptables peuvent encore être atteints avec une intervention humaine moindre.

  • La post-édition par l’IA offre de nouvelles possibilités en termes d'expansion de l'audience et de réduction des coûts.

Comprendre la post-édition par IA : réponses à vos principales questions

Nous savons que la précision a longtemps été un défi avec les solutions de TA. C'est pourquoi nous adoptons une approche axée sur l'IA tout en maintenant l'implication humaine pour configurer, contrôler et effectuer la maintenance de la machine.

L’IA permet d'améliorer les résultats de traduction des outils traditionnels, tels que les mémoires de traduction (MT) et la traduction automatique neuronale (NMT).

Notre expérience en matière de post-édition par l'IA démontre qu’elle est capable de répondre aux besoins d’évolutivité et de maintenir la qualité. Néanmoins, la supervision humaine est essentielle pour surveiller et ajuster l’outil afin de garantir l’exactitude et de répondre aux exigences spécifiques du contenu.

Notre solution de post-édition par l'IA commence par une évaluation initiale du contenu source afin d'en comprendre le contexte global. Les étapes d’édition et de validation sont réalisées en tenant compte de ce contexte, garantissant que les traductions produites correspondent aux objectifs et/ou aux profils du contenu.

Nous avons conçu notre solution de post-édition par l'IA pour qu'elle soit configurable : les invites linguistiques peuvent être modifiées et mises à jour en fonction des commentaires des linguistes et des experts du client impliqués dans le processus de traduction.

De plus, Lionbridge propose d’autres solutions d’IA qui nous permettent d’effectuer une analyse de la source et de produire des rapports qui présentent les recommandations de modifications à apporter au contenu source. Nous pouvons associer ces solutions à notre solution de post-édition par l'IA afin d'optimiser encore un peu plus la stratégie en matière de contenu.

Notre solution de post-édition par l'IA nous permet de définir et de cibler les domaines dans lesquels l’implication linguistique humaine est la plus utile.

Grâce à notre cadre REACH, nous travaillons avec nos clients pour évaluer les besoins en contenu et configurer la solution d'IA afin d'optimiser le résultat de la traduction. Nous pouvons ensuite définir différents degrés d’implication humaine, en veillant à ce que le niveau d’intervention corresponde aux besoins et aux profils du contenu.

La gestion de la terminologie spécifique à un secteur variant selon la langue et la région est un défi, mais elle peut être abordée de plusieurs manières.

En exploitant les métadonnées, nous sommes en mesure de fournir un contexte plus large aux outils d’IA et de demander au LLM de prendre en compte certaines exigences supplémentaires, telles que les nuances régionales, en supposant que le contenu soit correctement étiqueté et tagué. Lionbridge propose des services de données aux entreprises afin de répondre à cette condition préalable.

Lorsque la terminologie doit être adaptée par zone ou région, nous avons recours à un cadre RAG. Pour la post-édition par l'IA, nous formulons des directives afin que le LLM effectue certaines actions spécifiques basées sur des règles linguistiques définies.

La configuration de notre solution permet également de tenir compte de documents externes en guise d'exemples supplémentaires. Ainsi, le LLM peut générer du contenu plus adapté à des contextes spécifiques.

Étant donné que ce type de contenu a tendance à évoluer au fil du temps, il est essentiel d'assurer la maintenance et la mise à jour des invites linguistiques. C'est pourquoi nos solutions d'IA sont conçues pour être contrôlées et supervisées par des humains.

Oui, notre solution de post-édition par l'IA est indépendante du LLM et n'est liée à aucun modèle spécifique. Bien qu'elle ait été calibrée avec les modèles de GPT d'OpenAI, nous pouvons travailler avec les clients pour remplacer ceux-ci par leurs propres moteurs LLM.

Ce scénario relève d’une configuration personnalisée et peut nécessiter une évaluation/configuration supplémentaire afin de garantir que le LLM répond aux normes de qualité.

Pour ces solutions, nous vous recommandons de collaborer avec nos équipes en charge des solutions et technologies linguistiques afin de déterminer vos besoins, vos objectifs et vos exigences.

Notre solution de post-édition par l'IA propose des invites linguistiques configurables, qui peuvent évoluer en fonction des besoins en matière de contenu et des exigences réglementaires. Bien que nous proposions un processus axé sur l’IA, le contrôle et la sélection des invites linguistiques restent du ressort des humains (linguistes informatiques, experts en la matière (SME) et experts linguistiques) à des fins d’optimisation et de calibrage.

Les modèles de LLM génériques, non entraînés et basés sur des chatbots, ont du mal à gérer le ton, le contenu et les nuances culturelles. Notre solution relève ce défi en s'appuyant sur une méthodologie configurable qui fournit au LLM des instructions spécifiques, le but étant de définir le style, le ton et la terminologie, ainsi que des directives linguistiques relatives au contexte du contenu original. Grâce à une configuration contrôlée des paramètres et des invites linguistiques, nous sommes à même d'améliorer les processus de traduction avec la post-édition par l’IA.

Notre solution commence par inciter le LLM à comprendre le contexte du contenu source. Nous utilisons ce contexte pour guider la prise de décision et l'édition par le LLM, et fournissons des instructions pour évaluer la terminologie, modifier les correspondances partielles et valider les traductions au niveau du segment. Cela permet de garantir que l'IA fonctionne selon des paramètres définis. Notre approche permet également des mises à jour continues des invites linguistiques. Ainsi, si des hallucinations se produisent, nous pouvons ajuster et corriger les problèmes éventuels.

Les testeurs humains sont généralement des linguistes informaticiens ou expérimentés en ingénierie des invites. Ils sont responsables de la conception, des tests et de la mise à jour des paramètres de notre solution de post-édition par l'IA. Ces linguistes valident les résultats et fournissent des commentaires, qui sont ensuite utilisés pour ajuster et affiner les invites et les paramètres linguistiques.

Vous souhaitez explorer d’autres sujets de webinaires liés à l’IA proposés par Lionbridge ? Consultez la page des webinaires Lionbridge pour accéder à une bibliothèque des enregistrements de webinaires.

Nous contacter

Vous souhaitez bénéficier de la puissance de la post-édition par l’IA pour répondre à vos besoins en matière de traduction et de localisation ? Lionbridge peut vous aider à mettre en place des flux de travail agiles et évolutifs qui combinent automatisation, LLM et expertise humaine. Contactez Lionbridge dès aujourd'hui pour transformer votre diffusion de contenu et étendre votre portée dans le monde entier, plus rapidement, plus intelligemment et avec un impact plus important.

 

Remarque : l'application Lionbridge Content Remix a initialement créé l'article de blog récapitulatif, qu'un humain a ensuite peaufiné.

linkedin sharing button

RÉDIGÉ PAR
Janette Mandell

Parlons-en

Veuillez saisir votre adresse électronique professionnelle