A woman interacts with a holographic computer interface

Webinar-Zusammenfassung: Generative KI für globale Inhalte

Ein Überblick über generative KI, große Sprachmodelle und wie diese die Übersetzungsbranche dramatisch verändern werden

Zuletzt aktualisiert: 28. Juni 2023, 17.39 Uhr

Was genau steckt hinter den Technologien generativer KI (GenAI) und großer Sprachmodelle (Large Language Models, LLMs)? Wie werden GenAI und LLMs, wie z. B. ChatGPT, die Übersetzung und Lokalisierung revolutionieren? Und wie können Sie LLMs nutzen, um globale Content-Workflows zu optimieren?

Vincent Henderson, Leiter des Produkt- und Entwicklungsteams bei Lionbridge, beantwortete diese und weitere Fragen im ersten Teil einer Reihe von Webinaren zum Thema generative KI und große Sprachmodelle.

Wenn Sie unser Webinar verpasst haben, können Sie es einfach nach Bedarf ansehen.

Webinar ansehen

Wenn Sie gerade wenig Zeit zur Verfügung haben, können Sie auch eine Zusammenfassung einiger Themen lesen, die während des Webinars angesprochen wurden.

Generative KI und große Sprachmodelle – was ist das?

Dabei handelt es sich um Maschinen mit künstlicher Intelligenz (KI), die gelernt haben, wie ein Mensch Texte anhand des Korpus bereitgestellter Internetdaten zu verfassen. Entsprechend der Vorlage können sie jeden beliebigen Text anhand der gelernten Informationen durch einen weiteren sinnvollen Textblock vollständigen.

Auf der Grundlage aktueller KI und enormer Datenmengen entscheiden die Technologien dann, was als Antwort oder Reaktion ausgegeben werden soll.

Obwohl ihre Fähigkeit, das plausibelste nachfolgende Ergebnis zu bestimmen, trivial erscheinen mag, ist die Aufgabe äußerst anspruchsvoll. Bei der Texteingabe kann die Maschine den Inhalt ganzheitlich betrachten und herausfinden, wie er in das Gesamtbild der Sprache passt, um eine passende Antwort zu generieren. Sie legt fest, was in der Anforderung und im Trainingskorpus am wichtigsten und worauf zu achten ist.

Dadurch haben die LLMs die verblüffende Fähigkeit, Texte zu erstellen, die aussehen, als seien sie von einem Menschen erstellt worden. Die Technologie scheint nicht nur unsere Absichten zu verstehen, sondern auch so zu denken und zu handeln wie wir.

Wozu sind LLMs in der Lage?

Basierend auf dem Lernprozess kann ein LLM, wie etwa ChatGPT, mehrere Dinge tun:

Es beantwortet Fragen. Geben Sie eine Frage ein, und es wird einen sehr plausiblen Text als Antwort liefern.
Es folgt Anweisungen. Geben Sie eine Reihe von Anweisungen ein, und Sie erhalten ein Ergebnis, das auf der Grundlage ihrer Beachtung am wahrscheinlichsten ist.
Es lernt aus Beispielen. Geben Sie einige Beispiele und das gleiche Format vor, und es wendet in der Antwort das Beispielformat auf die eingegebenen Informationen an.

Warum sind LLMs so wichtig für die Übersetzung?

Um zu verstehen, was LLMs wie ChatGPT für die Übersetzung und Lokalisierung so vorteilhaft macht, sollten wir zunächst einige der Herausforderungen untersuchen, die bei neuronalen maschinellen Übersetzungen (Neural Machine Translation, NMT) auftreten.

Bisher haben sich Unternehmen auf maschinelle Übersetzungen (Machine Translation, MT) verlassen. Diese Engines stellen hochspezialisierte große Sprachmodelle dar, die darauf ausgerichtet sind, eine Folge von Wörtern zu untersuchen und dazu die passende Übersetzung zu finden. Der Einsatz herkömmlicher MT-Engines führt allerdings häufig zu suboptimalen Ergebnissen. Verbesserungen sind möglich, wenn man die Engine mit Zehntausenden von relevanten Datensätzen trainiert und optimiert.

Dies ist jedoch ein kostspieliges Unterfangen; Unternehmen, die MT-Engines einsetzen, müssen bei jedem neuen Projekt, z. B. bei der Einführung eines neuen Produkts oder bei Marketingmaßnahmen, immer wieder neu abwägen, ob sich der Aufwand und die Kosten lohnen.

LLMs hingegen lernen aus nur wenigen Beispielen, was ein Unternehmen erwartet oder benötigt. Ihr „Wissen” ist schließlich viel breiter aufgestellt. Dieses kann auch auf neue Projekte angewendet werden. So können die gewünschten Übersetzungsergebnisse mit einer einfachen, kontextabhängigen Eingabeaufforderung und ohne aufgabenspezifisches Modelltraining mit großen Datenmengen erzielt werden.

Bei der Entstehung dieses Artikels sind LLMs mit solchen Fähigkeiten jedoch stark nachgefragt und können noch nicht die Mengen an Inhalten bewältigen, die bei der Übersetzung im industriellen Maßstab anfallen. Das wird sich bald ändern, doch der Zeitpunkt lässt sich nur schwer vorhersagen.

LLMs oder MT-Engines – wer übersetzt besser?

Wie ist die Übersetzungsleistung von LLMs im Vergleich zu den MT-Engines? Lionbridge hat die Übersetzungsqualität der wichtigsten MT-Engines und GPT-Modelle mithilfe eines Satzes in den Sprachen Englisch-Chinesisch, Englisch-Spanisch und Englisch-Deutsch verglichen.

Generell schneidet GPT nicht ganz so gut ab wie die besten aktuellen MT-Engines. Die LLMs sind jedoch nahe dran. In einem Beispiel, wie in Abbildung 1 zu sehen ist, übertraf GPT-4 die Yandex-MT-Engine im Sprachpaar Englisch-Chinesisch sogar leicht.

Qualitätsvergleich der automatischen Übersetzung von GPT-Modellen und den wichtigsten NMT-Engines für das Sprachpaar Englisch-Chinesisch

Weitere Vergleichsergebnisse von Engines für verschiedene Bereiche und Sprachen finden Sie im Lionbridge Machine Translation Tracker, dem ältesten Bewertungstool für automatisierte Übersetzungslösungen.

Wie schneiden LLMs wie GPT in anderen Bereichen ab?

Wortschatz, Grammatik und Genauigkeit

Ohne spezifische Anweisungen übersetzen LLMs wie GPT eher umgangssprachlich im Vergleich zu den großen MT-Engines. Diese Praxis steht im Widerspruch zu der Arbeitsweise professioneller Übersetzer und kann deshalb durchaus als Fehler angesehen werden. Zudem kann GPT manchmal Neologismen oder neue Ausdrücke erfinden, die Sprachexperten eher vermeiden würden.

LLMs dazu zu bringen, eine bestimmte Terminologie zu verwenden, ist recht einfach. Man formuliert schlichtweg die entsprechende Anforderung. Im Gegensatz dazu ist das Einbinden eines bestimmten Wortschatzes bei MT-Engines bedeutend aufwändiger. Die Engines müssen dafür trainiert oder ein Überbau muss für sie erstellt werden, um die gewünschte Terminologie in den Ergebnissen oder im Quelltext abzubilden. In der Regel führt diese Vorgehensweise zu Problemen mit der Konjugation oder Konkordanz.

Da GPT so sprachbewusst ist, macht es nur selten solche sprachlichen Fehler. Es korrigiert sich außerdem für gewöhnlich selbst, wenn es dazu aufgefordert wird.

Was können große Sprachmodelle sonst noch leisten?

Analyse und Verbesserung der Ausgangs- und Zieltexte

LLMs sind vor allem vielseitig. Sie können dazu eingesetzt werden, sowohl den Ziel- als auch den Ausgangstext zu verbessern. Die Analyse geht dabei über die quantitative Betrachtung von Häufigkeiten, Mengen und Längen hinaus und umfasst auch die qualitative Bewertung und automatische Korrekturen. Weisen Sie LLMs einfach an, die Dinge auf eine bestimmte Art und Weise zu tun, und Sie erhalten das gewünschte Ergebnis.

Mit ChatGPT können Sie:

komplexe Terminologie vereinfachen oder Inhalte zur besseren Lesbarkeit und Übersetzbarkeit umformulieren
lange Sätze ohne Bedeutungsveränderung kürzen, um die Lesbarkeit und Übersetzbarkeit zu verbessern

Das Verwenden von LLMs zur Verbesserung der Lesbarkeit von Inhalten macht diese auch für Ihre Zielgruppen leichter zugänglich. Durch die Verbesserung des Ausgangstextes und die Reduzierung der Wortanzahl können Sie zudem Ihre Übersetzungskosten senken.

Post-Editing und sprachliche Qualitätssicherung

Statt einen professionellen Übersetzer können Sie LLMs mit dem Post-Editing Ihrer Übersetzungen beauftragen. Sind die Sprachmodelle dafür gut geeignet? Eine Analyse hat ergeben, dass der Aufwand, um einen Satz in seine endgültige Fassung zu bringen, bzw. die Bearbeitungsdistanz von 48 Prozent auf 32 Prozent reduziert werden konnte. Außerdem können Fehler wie zusätzliche Leerzeichen gefunden, eine bessere Wortwahl vorgeschlagen und der Zieltext durch eine Neufassung verbessert werden.

Welche neuen Dienste können Sprachdienstleister wie Lionbridge für Content-Workflows anbieten?

Die generative KI wird die Arbeitsabläufe für mehrsprachige Inhalte grundlegend verändern. Wir bieten Ihnen Lösungen, die mit diesen Veränderungen einhergehen.

Services für die Erstellung mehrsprachiger Inhalte

Die Fähigkeit von LLMs, mehrsprachige Inhalte zu generieren, ist wohl die größte Entwicklung in der Übersetzungsbranche seit der Einführung von Translation Memories (TMs).

Damit LLMs von Grund auf mehrsprachige Inhalte generieren, müssen sie lediglich mit Informationen gefüttert werden. Anschließend fordern Sie das Modell auf, abgeleitete Inhalte zu produzieren und diesen Content von Grund auf mehrsprachig zu gestalten.

LLMs ermöglichen es Unternehmen, Produktbeschreibungen, Tweets und anderes Material auf der Grundlage von Daten zu erstellen, die Ihnen bereits vorliegen. So vermeiden Sie auch „Halluzinationen”, zu denen LLMs neigen, wenn Sie diese nach realen Objekten oder Begebenheiten fragen.

In der Vergangenheit basierten globale Content-Workflows auf zwei getrennten Arbeitsabläufen: einem für die nationale und einem für die globale Produktion von Inhalten. Wenn Sie LLMs verwenden, werden die abgeleiteten Inhalte nicht in Ihrer Ausgangssprache verfasst und anschließend übersetzt. Stattdessen erstellen Sie den abgeleiteten Inhalt von Grund auf in allen benötigten Sprachen und lassen diesen anschließend von Post-Editoren für die jeweiligen Sprachen einschließlich Ihrer Landessprache bearbeiten.

Lionbridge ist dank seiner großen Anzahl von Sprachexperten bestens dafür gerüstet, mehrsprachige Post-Editing-Services auf der Grundlage von mehrsprachig generiertem Content anzubieten.

Unterstützung mehrsprachiger generativer KI-Initiativen von Kunden

Um LLMs für die Generierung mehrsprachiger Inhalte zu verwenden, müssen Aufforderungen oder Prompts erstellt werden. Das ist zeitaufwändig und häufig mit viel Herumprobieren verbunden. Die Unterstützung von Unternehmen bei der Erstellung geeigneter Prompts ist ein neu entstehender Bereich in der Übersetzungsbranche. Auch dabei kann Lionbridge Sie unterstützen.

Wir können die KI-Nutzung durch Backend-Entwicklung vereinfachen und Kundenunternehmen dabei helfen, die Art von Content zu kuratieren, die sie als Beispiele und Prompts für mehrsprachige generative KI-Initiativen unter eigener Regie verwenden.

Optimierung mehrsprachiger Assets

GPT kann linguistische Assets wie Translation Memories und stilistische Regeln modifizieren.

Lionbridge nutzte GPT-4 bereits, um für ein komplettes französisches TM die informelle Anrede umzusetzen und Tonalität und Stil an die Spezifikationen des Kunden anzupassen – und das kostengünstiger, als es zuvor möglich war.

Einzelheiten zur Fallstudie

250

Übersetzungseinheiten

4.5

Millionen Wörter

98.5%

Genauigkeitsfaktor

Verbesserungen der Übersetzungsworkflows

Diese Kategorie bezieht sich auf den Einsatz von LLMs, um das Post-Editing einfacher, schneller und kostengünstiger zu gestalten und damit letztlich den gesamten Übersetzungsworkflow effektiver und kostengünstiger zu machen.

Durch die Verbesserung dieser Arbeitsabläufe wird es für Unternehmen noch leichter, Inhalte übersetzen zu lassen.

Das Fazit: Wie sind die Aussichten für die Zukunft?

LLMs werden die Übersetzungsbranche revolutionieren. Arbeitsabläufe werden mit der Zeit immer schlanker werden.

Anstatt mit getrennten nationalen und globalen Workflows zu arbeiten, werden Unternehmen in der Lage sein, Inhaltsziele zu definieren, den Content besser vorauszuplanen und diesen dann sofort in mehreren Sprachen zu erstellen.

Zwar rufen neue Technologien oft Ängste in Bezug auf den Verlust von Arbeitsplätzen hervor, wir machen uns jedoch keine Sorgen darüber, dass Übersetzer oder Sprachdienstleister durch LLMs auf der Strecke bleiben könnten.

Unternehmen, die LLMs für die Erstellung mehrsprachiger Inhalten einsetzen, werden auch weiterhin Fachleute für die Überprüfung der maschinellen Ausgabe benötigen. Es kommt im Grunde dem Nachbearbeiten der maschinellen Übersetzung gleich. In Zukunft nennen wir es vielleicht anders.

„Die gesamte Sprachbranche muss auf die Herausforderung durch die LLMs reagieren. Das ist wirklich spannend. Wir stehen quasi am Anfang einer explosionsartigen Ausbreitung von Anwendungsfällen für die LLM-Technologie.”

– Vincent Henderson, Produktverantwortlicher bei Lionbridge, Language Services

Um mehr über generative KI zu erfahren und sie bei Demos in Aktion zu sehen, können Sie sich gleich unser Webinar anschauen.

Nehmen Sie Kontakt mit uns auf

Wenn Sie erfahren möchten, wie Lionbridge Sie dabei unterstützen kann, Ihre globalen Content-Workflows mithilfe der neuesten Technologie effizienter zu gestalten, nehmen Sie noch heute Kontakt mit uns auf.

VERFASST VON

Janette Mandell

#technology
#webinar
#translation_localization
#ai
#generative-ai
#blog_posts

WAS WIR TUN

KI

BRANCHEN