Fortschritte in der maschinellen Übersetzung und ihre Auswirkungen auf Sprachdienstleistungen

Die Sprachdienstleistungsbranche durchlebt ein spannende Zeit.

Die Anwendung künstlicher Intelligenz und neuronaler Netzwerke auf die komplizierte Verarbeitung natürlicher Sprachen wie bei der Spracherkennung und der maschinellen Übersetzung (auch bekannt als MT für Machine Translation und automatische Übersetzung) sorgt derzeit für rasante Fortschritte.

So gab Microsoft im Oktober 2016 die Ankündigung heraus, dass das eigene Spracherkennungssystem nun gesprochene Sprache genauso gut erkennen kann wie ein Mensch.

Die neurale maschinelle Übersetzung von Google ist überall in den Nachrichten: Der kürzlich in der New York Times erschienene Artikel von Gideon Lewis-Kraus „The Great Awakening“ (Das große Erwachen) ist eine ausgezeichnete Zusammenfassung der Google-Projekte zur Entwicklung von Übersetzungsprogrammen im Bereich der künstlichen Intelligenz und erläutert deren Anwendung auf die automatische Übersetzung von Sprache.

Selbst im Vergleich zu den hauseigenen Entwicklungen in der statistischen maschinellen Übersetzung erzielt die neurale maschinelle Übersetzung von Google wirklich beeindruckende Fortschritte: Die Übersetzungen werden zunehmend flüssiger und grammatikalisch korrekter.

Google ist mit seinen Entwicklungen zwar in der Presse sehr präsent, aber man sollte dabei nicht vergessen, dass auch andere Unternehmen erhebliche Fortschritte in der Entwicklung neuraler MT vorzuweisen haben: Seit der Trend vor etwa 10 Jahren weg von der regelbasierten maschinellen Übersetzung und hin zu statistischen Methoden gegangen ist, konnten auch Microsoft, Baidu, Systran und andere einen großen Sprung in der Qualität ihrer maschinellen Übersetzungen verzeichnen.

Auch die internen Tests unterschiedlicher neuraler MT-Systeme bei Lionbridge stützen diese Behauptung.

Kurzfristiger Erfolg von neuraler MT: Das Einsatzgebiet ist breiter geworden

Die Qualität von MT steigt rasant, was die Nutzung als Prozessschritt und die manuelle Nachbearbeitung (Post-Editing) einfacher macht. Dieser Effekt zeigt sich besonders bei traditionell schwierigen Sprachrichtungen oder bei Inhalten, die bislang als zu komplex oder nuanciert für eine effiziente MT-Nachbearbeitung galten.

Lionbridge verzeichnet einen Anstieg in der Menge der Wörter, die wir anhand von maschineller Übersetzung verarbeiten.

Der Einsatz von neuraler MT bedeutet dass wir Übersetzungen von hoher Qualität noch effizienter anbieten können.

Außerdem gibt es immer mehr Anwendungsbereiche, in denen unüberwachte MT eine geeignete Übersetzungslösung ist.

Die Genauigkeit und Zuverlässigkeit von MT-Systemen hängt
(a) von der Qualität und Quantität des Trainingsmaterials,
(b) vom Entwicklungsstand der Algorithmen für maschinelles Lernen und
(c) von der Ähnlichkeit zukünftiger Texte mit dem Trainingsmaterial ab.

Das heisst MT ist nie besser als das Trainingsmaterial. Bei der Übersetzung neuer Inhalte, die im Trainingsmaterial nicht ausreichend vorhanden sind, kann MT keine guten Ergebnisse erzielen.

Sprach-Experten müssen weiterhin MT-Ergebnisse prüfen und korrigieren

Selbst bei besserer Ausgangsqualität und dem Versprechen, neurale MT-Systeme auch mit kleineren Datenmengen trainieren zu können, wird es daher auch in Zukunft nötig sein, dass ein Sprach-Experte die MT-Ergebnisse überprüft und korrigiert. Auch das Trainingsmaterial muss linguistisch gepflegt werden, die Trainingsprozesse müssen durch Experten überwacht werden und – fast noch wichtiger – die Übersetzungsprozesse in den Unternehmen müssen von Experten durchgeführt und überwacht werden.

Maschinelle Übersetzung: Unsere Strategie

Lionbridge hat in den 20 Jahren seiner Firmengeschichte stets ein Ziel verfolgt: die immer effizientere Bereitstellung von Übersetzungen.

Unsere ersten Erfahrungen mit MT datieren aus den späten 1990er Jahren. Seit 2004 bieten wir umfassende Dienste in der Nachbearbeitung an. Trotz – oder vielleicht auch gerade wegen – unserer langjährigen Erfahrungen mit dieser Technologie haben wir erkannt, dass die ständige Weiterentwicklung eines wirklich erstklassigen eigenen MT-Systems von einer großen Menge erfasster Daten, enormen Rechenleistungen und der Entwicklung von Ressourcen abhängt, bei denen die großen Tech. Player wie Google und Microsoft deutliche Vorteile haben.

Neuronale Netzwerke, Big Data und Deep Learning via API

Daher hat Lionbridge kein MT-System entwickelt oder gekauft, sondern eine einzigartige MT-Strategie ausgearbeitet. Wir konzentrieren uns bei unseren eigenen Entwicklungen auf eine flexible API-gesteuerte Infrastruktur. Mit diesem Ansatz können wir die beste MT-Technologie nutzen und durch unsere linguistische Expertise und unsere Erfahrungen steuern – die beste Lösung, um die großen Herausforderungen der Übersetzungs- und Lokalisierungsbranche beim Schopf zu packen.

 

Kurz, wir bei Lionbridge sind von den Fortschritten der neuralen maschinellen Übersetzung begeistert.

Ohne Zweifel: Mit dieser neuen Technologie können wir die Dienstleistungen für unsere Kunden verbessern.

Neurale MT ist nicht die einzige Änderung ...

Die Lokalisierungsbranche erfährt Veränderungen, die wir bereits in vielen anderen Branchen beobachten konnten.

In den letzten 5 bis 7 Jahren hat sich die Größe von Dateien aufgrund neuer Eigenschaften der veröffentlichten Inhalte dramatisch reduziert. Die gewichtete Wortzahl in den Dateien ist von mehreren Tausend auf durchschnittlich unter Hundert gesunken. Daraus folgt, dass die Transaktionskosten häufig höher liegen als die eigentlichen Übersetzungskosten.

Aus diesem Grund konzentriert sich Lionbridge darauf, die Transaktionskosten zu senken – und setzt dazu die effizienteste Lifecycle-Management-Lösung für die Inhaltslokalisierung in der Branche ein. In diesem System wird der gesamte Prozess vom Abruf des Inhalts aus dem Repository des Kunden über die Übersetzung in mehrere Sprachen (mit MT, menschlicher Übersetzung oder beidem) und die Qualitätskontrolle bis hin zur Rückgabe an den Kunden verwaltet.

Dieser Prozess läuft automatisch ab: Eine intelligente Infrastruktur erstellt Pakete aus den Inhalten und übergibt diese zum richtigen Zeitpunkt an den richtigen Linguisten.

Vor dem Hintergrund, dass sich in der Branche eine deutliche Entwicklung hin zu einer Bereitstellung mehrsprachiger Kommunikation zeigt, gewinnt eine intelligente Infrastruktur sogar noch mehr an Bedeutung. Das System muss den Inhalt verstehen, damit es ihn in die richtigen Workflows lenken, in passenden Paketen zusammenstellen und, falls eine Bearbeitung durch einen Menschen erforderlich ist, an den passenden Bearbeiter weiterleiten kann.

Wie bereits erwähnt, liegt der Schlüssel zum Erfolg maschineller Übersetzung in Investitionen außerordentlich großen Umfangs, zu denen nur die größten Technologieunternehmen in der Lage sind. Eine Weisheit beim Militär besagt: „Amateure sprechen über Taktik – Profis beschäftigen sich mit Logistik.“

Und deshalb liegt der Schwerpunkt bei Lionbridge auf der Logistik: Wir produzieren Übersetzungen mit minimalen Fix- und Transaktionskosten.

Aus diesem Grund hat Lionbridge in eine cloudbasierte Technologie-Plattform investiert, in der wir den Lokalisierungslebenszyklus auf Segmentebene verwalten können. Wir rufen die Inhalte vom Repository des Kunden ab, verarbeiten ihn gemäß den jeweiligen Kundenanforderungen, stellen basierend auf konfigurierbaren Geschäftsregeln Pakete zusammen und geben diese dann in Echtzeit an den passenden Bearbeiter weiter.

Der Vorteil dieser Cloud-Plattform von Lionbridge? Die Automatisierung der einzelnen Prozesse und die Reduktion von Arbeitskosten an den einzelnen Touchpoints. Außerdem steigt die Qualität der maschinellen Übersetzung und macht die Plattform leistungsfähiger denn je.

linkedin sharing button
  • #blog_posts
  • #translation_localization

Lionbridge
AUTHOR
Lionbridge