Lionbridge-Expertenkommentar: Analyse automatischer Übersetzungen

Technologieexperten von Lionbridge befassen sich mit den Paradigmen maschineller Übersetzung und generativer KI und geben Einblicke in die neuesten Trends der automatischen Übersetzung.

KONTAKT

Maschinelle Übersetzungen bleiben trotz der revolutionären generativen KI relevant

Veränderungen und Entwicklungen der automatischen Übersetzung

Wir sind schon seit geraumer Zeit der Meinung, dass die maschinelle Übersetzung (Machine Translation, MT) reif für einen Wandel ist. Unsere Experten erklären, warum das so ist.

Sie sprechen unter anderem über die folgenden Themen:

Die Übersetzungsleistung von MT-Engines und Modellen generativer KI zu bestimmten Zeitpunkten und die Bedeutung der Ergebnisse im größeren Kontext
Die Grenzen von Tools für automatische Übersetzungen
Möglichkeiten zur Steigerung der Effizienz maschineller Übersetzung

Je mehr Sie über MT und generative KI wissen, desto gezielter können Sie die Tools für Ihren individuellen Bedarf einsetzen. Nutzen Sie die Stärken der verschiedenen Paradigmen, damit die Übersetzungseffizienz steigt, mehr Content generiert wird und Kosten gespart werden.

Kommentar eines Experten von Lionbridge

Auffällige Eigenheiten von GPT-4, Oktober 2023

Angesichts der Verbreitung und des Potenzials von generativer KI (GenKI) und großen Sprachmodellen (Large Language Models, LLMs) haben wir den Lionbridge Machine Translation Quality Tracker verbessert. Künftig wird der Bericht neben den Ergebnissen von GPT-3.5 und Davinci auch GPT-4-Übersetzungsergebnisse und natürlich die Leistung der NMT-Engine (neuronale MT) enthalten.

Welche neuen Ergebnisse zeichnen sich ab? Für GPT-4 gelten einige Besonderheiten.

Wir mussten mit einigen Problemen zurechtkommen, darunter schlechte Performance, die aus verschiedenen Gründen auftretende Unfähigkeit, Übersetzungen bereitzustellen, und inkonsistentes Verhalten wie das Fehlen von Übersetzungen in manchen Situationen, während die Übersetzungen bei anderer Gelegenheit erstellt wurden.

Ergebnis 1: GPT-4 hat Text gelegentlich nicht übersetzt.

GPT-4 hat einen bestimmten Satz in unserem MT-Testtext nicht übersetzt.

Nach einigen Recherchen konnten wir feststellen, dass dieses Problem auftrat, wenn ein Begriff mit sexueller Konnotation in bestimmten Kontexten verwendet wurde. Der fragliche Satz war dabei völlig normal und in keiner Weise anstößig. Trotzdem löste er den GPT-4-Filter für sexuelle Inhalte aus. In der Folge zensierte die KI die Übersetzung des Satzes, sodass er nicht ausgegeben wurde. Dies hat uns aus zwei Gründen überrascht:

Die typische Verwendung dieses Begriffs an sich war einwandfrei.

Es gab keine problematische Interpretation im Kontext dieses Satzes.

Wir schlossen daraus, dass der GPT-4-Filtermechanismus zumindest in Teilen auf einer einfachen Liste verbotener Wörter basiert und dass diese Liste auch mehrdeutige Begriffe enthält. Dieser Ansatz ist problematisch, weil er Überreaktionen und Fehlalarme sehr wahrscheinlich macht. Bei professionellen Übersetzungen kann dies ernsthafte Komplikationen verursachen.

Da frühere Technologien für maschinelle Übersetzung wie Engines auf Basis neuronaler MT dieses Problem beim Filtern der Inhalte nicht aufweisen, sind wir zu der Überzeugung gelangt, dass es sich um eine der LLM-Technologie innewohnende Restriktion handelt.

Diese Restriktion ist aber für reale Szenarien relevant. Stellen Sie sich zum Beispiel vor, Sie müssten medizinischen Content übersetzen, der im Bereich der Gynäkologie oder Sexualaufklärung angesiedelt ist. Sie müssen dann überracht feststellen, dass ein Teil des Textes vom Sprachmodell nicht übersetzt wird.

Interessanterweise trat dieses Problem nur bei der Übersetzung des betreffenden Satzes ins Chinesische auf, nicht bei Übersetzungen in andere Sprachen. Das wiederum deutet darauf hin, dass die Ausgabe von GPT-4 gefiltert wird. Die Lösung besteht hier einfach darin, den Inhaltsfilter für Übersetzungen zu deaktivieren.

Ergebnis 2: GPT-4 produziert unterschiedliche Ausgaben.

Wir haben festgestellt, dass die Qualität der maschinellen Übersetzung mit LLMs nach fünfwöchiger Beobachtung sehr unterschiedlich war. Das galt insbesondere für GPT-4.

Obwohl wir dieses Ergebnis für generative KI erwartet hatten, war die Inkonsistenz bedeutend signifikanter als erwartet. Sie trat auch auf, nachdem die Kreativität mit den Paramatern „Temperature” und „Top Probability” (Top_p) reduziert und die Ausgabe restriktiver konfiguriert wurde. Jeder einzelne GPT-Durchlauf lieferte unterschiedliche Ergebnisse, auch wenn die Durchläufe unmittelbar nacheinander ausgeführt wurden.

Beide Übersetzungen können trotz der Unterschiede von akzeptabler Qualität sein. Nichtsdestotrotz ist dies ein weiterer Aspekt, bei dem es an Kontrolle und Feinschliff mangelt, und eine weitere Differenz zum bisherigen Paradigma neuronaler MT.

Es zeichnet sich langsam ab, dass dieser potenzielle Paradigmenwechsel – von NMT zu LLM-MT – nicht nur einen technologischer Wandel darstellt, sondern auch eine Änderung unserer Denkweise erforderlich macht: Wahrscheinlich müssen wir uns an weniger deterministische Ergebnisse gewöhnen, auch bei Verwendung identischer Eingabedaten und Parameter. Und mit mehr Variabilität rechnen, als wir es von den aktuellen Automatisierungsverfahren gewohnt sind.

Aber auch wenn wir bis zu einem gewissen Grad mit mehr Unschärfe leben müssen, werden verschiedene Mechanismen und Best Practices dabei helfen, die Varianzen einigermaßen unter Kontrolle zu halten.

Schließlich können Sie unserem Diagramm entnehmen, dass die verringerte Levenshtein-Distanz für GPT-4 nicht auf eine geringere Qualität hindeutet. Sie ist vielmehr Ausdruck der grundsätzlichen Variabilität von GPT-Ausgaben. Es ist durchaus möglich, dass die Linie im nächsten Monat wieder steigt. Wir informieren Sie hier über alle neuen Entwicklungen und Erkenntnisse.

—Rafa Moral, Lionbridge Vice President, Innovation

Liste der von Experten kommentierten Themen

Unten können Sie in der Liste der bereits von Experten kommentierten Themen blättern.

März 2023 — Ein großes Sprachmodell (Large Language Model, LLM) übertrifft eine neuronale Engine für maschinelle Übersetzung (NMT-Engine). Und nun?

Februar 2023 — Verbesserung der maschinellen Übersetzung: Anpassung & Training

Januar 2023 — Vergleich der Übersetzungsqualität zwischen ChatGPT und den wichtigsten MT-Engines

November 2022 — Verbesserungen bei der MT-Engine von Microsoft

Oktober 2022 — MT und formelle Sprache

September 2022 — Verwendung von Terminologie zur Verbesserung der MT-Qualität

August 2022 — Bewältigen kritischer Fehler bei maschinellen Übersetzungen

Juli 2022 — Sprachen-Ranking für MT

Juni 2022  — Genaue Analyse der MT-Qualität

Mai 2022  — Leistungswerte von Amazon und Yandex im Mai

April 2022 — So schneidet Yandex im April ab

März 2022 — Individuelle MT-Engines im Bewertungsvergleich

Februar 2022 — Die Zukunft der Neuronalen Maschinellen Übersetzung (NMT)

Januar 2022 — Leistungsdaten der MT-Engines im Januar

Dezember 2021 — Lionbridge nimmt Yandex MT in den MT Quality Tracker Wettbewerbscheck auf

November 2021 — Bing Translator macht Fortschritte

Oktober 2021 — Welche Fortschritte die MT-Engine von Amazon macht

September 2021 — Amazon verbessert die MT-Qualität

August 2021 — Top-Tech-Unternehmen und die Entwicklung ihrer MT-Engines

Lionbridge Machine Translation Tracker

Lionbridge Machine Translation Tracker ist das am längsten aktive Benchmarkingtool für die wichtigsten MT-Engines der Branche.

Der Tracker misst die Gesamtleistung der fünf wichtigsten neuronalen MT-Engines und mehrerer KI-Modelle. Er bewertet zudem die Übersetzungsqualität auf der Grundlage von Sprachpaaren und Fachbereichen. Abgesehen von einigen Ausnahmen kann die generative KI die wichtigsten neuronalen MT-Modelle nicht übertreffen. Dennoch liefern diese Modelle akzeptable Ergebnisse. Dies gilt umso mehr, weil sie nicht speziell für Übersetzungen trainiert wurden.

Was folgt daraus? Trotz wachsendem Interesse an der generativen KI und an großen Sprachmodellen erweist sich die maschinelle Übersetzung nach wie vor als bestes Übersetzungstool.

Die Ergebnisse ändern sich allerdings ständig, und der Tracker bildet diese Variationen ab.

Tracker aufrufen

Kommentare der Lionbridge-Experten

Lassen Sie sich von unseren Experten für automatische Übersetzungen beraten.

März 2023

Die generative Künstliche Intelligenz (KI) hat einen wichtigen Meilenstein erreicht: In einer unserer vergleichenden Bewertungen hat sie eine neuronale maschinelle Übersetzungs-Engine (Machine Translation, MT) übertroffen. So hat insbesondere das Large Language Model (LLM) GPT-4 für das Sprachpaar Englisch-Chinesisch eine etwas bessere Übersetzungsqualität als Yandex geliefert, wie in Abbildung 1 zu sehen ist.

Diese Entwicklung ist erwähnenswert, da zum ersten Mal seit Beginn der neuronalen maschinellen Übersetzung (Neural MT, NMT) ein anderer MT-Typ eine NMT-Engine übertroffen hat. Und das, obwohl es sich bei dieser Technologie um eine Mehrzweck-Sprachautomatisierungslösung handelt, die nicht speziell für die maschinelle Übersetzung entwickelt wurde.

Warum sollte Sie das interessieren? Wenn Sie ein Anbieter maschineller Übersetzungen sind, müssen Sie an der Spitze des technologischen Fortschritts stehen und sich gut überlegen, wie sich dieser auf ihr aktuelles MT-Angebot auswirken wird, damit Sie wettbewerbsfähig bleiben. Wenn Sie maschinelle Übersetzungen einkaufen, müssen Sie über diese Entwicklungen auf dem Laufenden bleiben, um vernünftige MT-Investitionen zu tätigen, zu denen mit großer Wahrscheinlichkeit auch einige LLM-basierte Technologien (anstelle reiner NMT-Angebote) gehören.

Dabei muss hervorgehoben werden, dass die generative KI noch in den Kinderschuhen steckt und ihre Leistung in einigen Schlüsselbereichen nach wie vor unzureichend ist. So gibt sie bei mehrfacher Ausführung beispielsweise unterschiedliche Ergebnisse aus, hat eine instabile Programmierschnittstelle (Application Programming Interface, API) und produziert mehr Fehler als NMT-Engines. Damit die Technologie sich weiter entwickeln kann, müssen diese Fehler behoben werden. Allerdings nehmen wir bereits jetzt wahr, dass Verbesserungen in rasanter Geschwindigkeit voranschreiten.

Dieses unglaubliche Tempo, mit dem sich LLMs verbessern können, ist ein starkes Argument dafür, dass sie das nächste Paradigma in der maschinellen Übersetzung darstellen. Im Rahmen der Weiterentwicklung des Paradigmas wird es wahrscheinlich eine hybride Phase geben, in der NMT-Anbieter einige Aspekte der LLMs in die NMT-Architektur integrieren.

In unserem Blog wird die Übersetzungsqualität von NMT und LLMs für zwei weitere Sprachpaare miteinander verglichen. Darüber hinaus finden Sie dort weitere Überlegungen, ob dies der Anfang vom Ende des Paradigmas der neuronalen maschinellen Übersetzung ist.

—Rafa Moral, Lionbridge Vice President, Innovation

	MT-Anpassung
Was es ist und wie es funktioniert	Eine Anpassung einer bereits bestehenden MT-Engine mit Glossar und DNT-Liste, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern
Was es bewirkt	Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf
Besondere Vorteile	Ermöglicht es Unternehmen, am Markennamen festzuhalten, die eigene Terminologie zu wahren und regionale Unterschiede herauszuarbeiten
Risiken bei der Verwendung	Die MT-Vorschläge können von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn der MT-Prozess unangemessen ausgeführt wird
Einsatz	Ideal für technologische und detailorientierte Inhalte sowie für alle Inhalte, die Folgendes erfordern: * präzise Übersetzung von Fachterminologie * regionale Variante bei Mangel an Daten für MT-Training
Erfolgsfaktoren	Ein erfahrener MT-Experte, der Input- und Output-Normalisierungsregeln, Glossare und DNT erfolgreich verwalten kann
Überlegungen zu Kosten	Einmalige Kosten für die Aktualisierung des Profils, mit dem die MT-Engine gespeist wird, sowie laufende Kosten für die langfristige Pflege des Glossars; relativ preisgünstig, wenn man den potenziellen Nutzen berücksichtigt, und in der Regel unter den Kosten für MT-Training

	MT-Training
Was es ist und wie es funktioniert	Der Aufbau und das Training einer MT-Engine unter Verwendung umfangreicher zweisprachiger Daten aus Textkörper und Translation Memories, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern
Was es bewirkt	Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf
Besondere Vorteile	Ermöglicht es Unternehmen, eine bestimmte Markenstimme, einen bestimmten Ton und Stil durchzusetzen sowie regionale Unterschiede herauszuarbeiten
Risiken bei der Verwendung	Das Training bringt unter Umständen wenig Nutzen, wenn nicht genügend Qualitätsdaten zum Trainieren der Engine vorhanden sind; die MT-Vorschläge könnten von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn unerfahrene Linguisten Terminologie übermäßig nutzen
Einsatz	Ideal für hochspezialisierte Content, Marketing- und Kreativinhalte sowie für alle Inhalte, die Folgendes erfordern: * eine bestimmte Markenstimme, einen bestimmten Ton oder Stil * regionale Variante bei genügend Daten für MT-Training
Erfolgsfaktoren	Mindestens 15.000 eindeutige Segmente, um die Engine angemessen zu trainieren
Überlegungen zu Kosten	Kosten für das erste Training und potenzielle Kosten für weitere Trainingsaktivitäten, die mittelfristig zu erwägen sind, wenn die MT-Ergebnisse Optimierungsbedarf anzeigen; MT-Training lohnt sich in bestimmten Fällen angesichts der potenziellen Vorteile

	MT-Anpassung	MT-Training
Was es ist und wie es funktioniert	Eine Anpassung einer bereits bestehenden MT-Engine mit Glossar und DNT-Liste, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern	Der Aufbau und das Training einer MT-Engine unter Verwendung umfangreicher zweisprachiger Daten aus Textkörper und Translation Memories, um die Genauigkeit der maschinell erstellten Übersetzungen zu verbessern
Was es bewirkt	Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf	Verbessert die MT-Vorschläge im Sinne genauerer Ergebnisse und verringert den Nachbearbeitungsbedarf
Besondere Vorteile	Ermöglicht es Unternehmen, am Markennamen festzuhalten, die eigene Terminologie zu wahren und regionale Unterschiede herauszuarbeiten	Ermöglicht es Unternehmen, eine bestimmte Markenstimme, einen bestimmten Ton und Stil durchzusetzen sowie regionale Unterschiede herauszuarbeiten
Risiken bei der Verwendung	Die MT-Vorschläge können von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn der MT-Prozess unangemessen ausgeführt wird	Das Training bringt unter Umständen wenig Nutzen, wenn nicht genügend Qualitätsdaten zum Trainieren der Engine vorhanden sind; die MT-Vorschläge könnten von schlechter Qualität sein und sich negativ auf das Gesamtbild auswirken, wenn unerfahrene Linguisten Terminologie übermäßig nutzen
Einsatz	Ideal für technologische und detailorientierte Inhalte sowie für alle Inhalte, die Folgendes erfordern: * präzise Übersetzung von Fachterminologie * regionale Variante bei Mangel an Daten für MT-Training	Ideal für hochspezialisierte Content, Marketing- und Kreativinhalte sowie für alle Inhalte, die Folgendes erfordern: * eine bestimmte Markenstimme, einen bestimmten Ton oder Stil * regionale Variante bei genügend Daten für MT-Training
Erfolgsfaktoren	Ein erfahrener MT-Experte, der Input- und Output-Normalisierungsregeln, Glossare und DNT erfolgreich verwalten kann	Mindestens 15.000 eindeutige Segmente, um die Engine angemessen zu trainieren
Überlegungen zu Kosten	Einmalige Kosten für die Aktualisierung des Profils, mit dem die MT-Engine gespeist wird, sowie laufende Kosten für die langfristige Pflege des Glossars; relativ preisgünstig, wenn man den potenziellen Nutzen berücksichtigt, und in der Regel unter den Kosten für MT-Training	Kosten für das erste Training und potenzielle Kosten für weitere Trainingsaktivitäten, die mittelfristig zu erwägen sind, wenn die MT-Ergebnisse Optimierungsbedarf anzeigen; MT-Training lohnt sich in bestimmten Fällen angesichts der potenziellen Vorteile

WAS WIR TUN

BRANCHEN

RESSOURCEN

WER WIR SIND

Lionbridge-Expertenkommentar: Analyse automatischer Übersetzungen

Maschinelle Übersetzungen bleiben trotz der revolutionären generativen KI relevant

Veränderungen und Entwicklungen der automatischen Übersetzung

Kommentar eines Experten von Lionbridge

Auffällige Eigenheiten von GPT-4, Oktober 2023

Welche neuen Ergebnisse zeichnen sich ab? Für GPT-4 gelten einige Besonderheiten.

Ergebnis 1: GPT-4 hat Text gelegentlich nicht übersetzt.

Ergebnis 2: GPT-4 produziert unterschiedliche Ausgaben.

Liste der von Experten kommentierten Themen

Lionbridge Machine Translation Tracker

Kommentare der Lionbridge-Experten

März 2023

Februar 2023

Anpassung und Training maschineller Übersetzungs-Engines

Januar 2023

November 2022

Oktober 2022

September 2022

August 2022

Juli 2022

Juni 2022

Mai 2022

April 2022

März 2022

Februar 2022

Januar 2022

Dezember 2021

November 2021

Oktober 2021

September 2021

August 2021

Lernen Sie unsere Experten für maschinelle Übersetzung kennen

Rafa Moral

Yolanda Martin

Thomas McCarthy

Füllen Sie unser Kontaktformular aus, um mit uns ins Gespräch zu kommen.

Kontakt

BRANCHEN

Juli 2022 

Juni 2022