Was ist Machine Learning, Big Data und Natural Language Processing? Begriffe und Definitionen

Zuletzt aktualisiert am: März 10, 2020 7:47AM

2018 verwendeten bereits 36 Prozent der Deutschen regelmäßig Sprachassistenten und die Tendenz ist steigend. Das Verfahren, das dieser Innovation zugrunde liegt, ist das Natural Language Processing (NLP). Die Anfänge dieser Technologie reichen bis in die 50er-Jahre zurück, in denen es Forschern erstmals gelang, mithilfe einer Maschine russische Sätze ins Englische zu übersetzen.

Worum handelt es sich beim Natural Language Processing? NLP ist ein Teilgebiet der künstlichen Intelligenz (KI), bei der Computer lernen, menschliche Sprachen zu verstehen und selbst anzuwenden.

Durch die rasante technologische Entwicklung der letzten Jahrzehnte haben sich auch die Einsatzmöglichkeiten von NLP sehr stark erweitert. Im Handel werden heute schon überall Chatbots eingesetzt, die mit Kunden kommunizieren, und Sprachassistenten bieten neben der Steuerung von Apps viele weitere nützliche Funktionen.

Gerne beraten wir Sie bezüglich der Einsatzmöglichkeiten von NLP für Ihr Unternehmen.

Im folgenden Artikel erfahren Sie mehr über die Funktionsweise und die Anwendungsbereiche von Natural Language Processing. Um die Funktionsweise von NLP zu verstehen, ist es wichtig, die Entwicklungen und Begrifflichkeiten, welche Natural Language Processing ermöglichen, zu betrachten und voneinander abzugrenzen.

Was ist Machine Learning?

Während Menschen auf ihre Lebenserfahrung zurückgreifen, um Sprache zu verstehen, brauchen auch Maschinen eine Basis zur Interpretation von Aussagen. Beim Machine Learning (maschinelles Lernen) werden KI-Systemen große Datenmengen in Form von Texten zugänglich gemacht. Anhand dieser Informationen lernt nun die KI, wie Äußerungen richtig zu verstehen und zu übersetzen sind.

Um Texte zu verstehen, werden beim maschinellen Lernen die folgenden Schritte durchlaufen:

  • Ermittlung der Sprache: Die KI muss erkennen, um welche Sprache es sich handelt. Bei schriftlichen Texten ist das normalerweise durch einen einfachen Abgleich von Wörtern möglich. Bei gesprochener Sprache können sich schon hier Probleme ergeben, z. B. bei regionalen Dialekten, ausländischen Akzenten oder bei persönlichen Eigenheiten von Sprechern.
  • Identifizierung von einzelnen Wörtern und Sätzen: Leerzeichen, Kommas und Punkte vereinfachen diese Aufgabe bei schriftlichen Texten. Gesprochene Sprache ist weniger eindeutig und besteht oft aus unvollständigen oder formal nicht korrekten Aussagen.
  • Erfassung der grammatischen Grundformen: Die KI muss in der Lage sein, aus Wörtern wie „gesungen“ auf die Bedeutung „singen“ zu schließen.
  • Gliederung der Sätze anhand der syntaktischen Funktion der Wörter: Die KI muss bestimmen können, was Subjekt, Objekt und Verb in einem Satz ist. In dem Satz „Laut singt die Frau ein Lied.“ muss die KI also erkennen, dass die Frau das Subjekt ist und deshalb laut das Lied singt und nicht umgekehrt.
  • Bestimmung der Bedeutung von Sätzen: In diesem Schritt müssen die Wortbedeutungen und ihre grammatischen Beziehungen zueinander kombiniert werden. Worauf bezieht sich im obigen Beispiel das Wort „laut“? Welche Rolle spielen dabei die Frau und das Lied? Die KI muss alle diese Informationen aus der sprachlichen Form ableiten. Menschen nehmen immer ihr Weltwissen zu Hilfe, um eine Aussage zu verstehen – diese Option hat die KI nicht.
  • Klärung von Zusammenhängen zwischen Sätzen: Im letzten Schritt muss die KI den übergeordneten Kontext miteinbeziehen. Wenn z. B. der Satz „Sie klingt heiser.“ auf das Beispiel oben folgt, muss die KI erkennen, dass die Frau gemeint ist.

Damit die KI einen Text tatsächlich vollständig erfassen kann, müssen diese Schritte normalerweise sehr oft wiederholt werden. In Zeiten von Big Data wird es immer einfacher, große Textkorpora bereitzustellen, die mit immer schnellerer Technik verarbeitet werden können.

Was ist Big Data?

Um mit Computern zu kommunizieren, müssen diese mithilfe einer Programmiersprache mit Informationen und Anweisungen gefüttert werden. Eine Programmiersprache besteht zwar ebenfalls aus Zeichen, sie ist aber keine natürliche Sprache wie Deutsch, Englisch oder Kantonesisch.

Natürliche Sprachen, die von Menschen zur Kommunikation verwendet werden, sind unstrukturiert und vieldeutig. Wörter können verschiedene Bedeutungen haben und oft werden bei Äußerungen viele Hintergrundinformationen einfach vorausgesetzt. Dazu kommen Stilmittel wie Ironie und Übertreibungen, die den Inhalt einer Aussage entscheidend verändern können.

Was muss man also tun, damit Computer direkt mithilfe natürlicher Sprache kommunizieren können? Die Lösung ist ein Zusammenspiel von Big Data und KI. Mit Big Data sind große Datenmengen gemeint, die im digitalen Zeitalter einfach gesammelt und gespeichert werden können. Mit diesen Informationen lassen sich KI-Anwendungen trainieren und immer weiter optimieren.

Chatbot auf Smartphone kommuniziert durch künstliche Intelligenz direkt mithilfe natürlicher Sprache

Der Erfolg des NLP spricht für sich. Experten sagen voraus, dass sich der mit Sprachassistenten generierte Umsatz in den nächsten Jahren versechsfachen wird. Übersetzungsprogramme wie Google Translate können dank Big Data ständig ihre Fehlerquoten reduzieren und sind aus dem Unternehmensalltag längst nicht mehr wegzudenken.

NLP kann aber noch mehr. Die folgenden Funktionen werden in den nächsten Jahren verstärkt an Bedeutung gewinnen:

  • Texte vereinfachen und zusammenfassen: KI kann Kerninhalte aus Texten extrahieren und so die Lektüre erleichtern.
  • Suchbegriffe in natürlichen Sprachen verstehen: KI ist in der Lage, Suchbegriffe in einen Kontext zu setzen, statt nach reinen Wortfolgen zu suchen. So erhöht sich die Relevanz der Suchergebnisse.
  • Plausibilität von Antworten bewerten: KIs können nicht nur Antworten auf Fragen finden, sondern auch die Richtigkeit und Relevanz dieser Antworten bewerten.
  • Sprachsteuerung: Sprechende Computer können mit Menschen immer problemloser kommunizieren und Anweisungen entgegennehmen und ausführen.

Natural Language Processing ist einer der Big-Data-Anwendungsbereiche, die sich rasant weiterentwickeln. Das Ziel ist die Optimierung der Interaktion zwischen Mensch und Computer. Damit wird diese Technologie alle Bereiche der Arbeitswelt erfassen. Die Frage ist also nicht, ob NLP Bedeutung für Unternehmen gewinnen wird, sondern wie Firmen diese Technik gewinnbringend in ihre Geschäftsprozesse integrieren.

Wer nutzt Big Data?

Den meisten Unternehmen ist längst bewusst, dass Big Data und Data Analytics die Zukunft beherrschen werden. Trotzdem sieht es bei den Verantwortlichen, was das Know-how betrifft, oft noch schlecht aus, wie eine Umfrage zeigte.

Welche Branchen profitieren am meisten von Big Data und Natural Language Processing? Um diese Frage zu beantworten, darf man die NLP-Definition nicht zu eng fassen. Bei der Interaktion zwischen Menschen spielt Sprache in irgendeiner Form immer eine entscheidende Rolle. NLP-Technologien haben schon jetzt den größten Marktanteil im Bereich künstliche Intelligenz.

NLP kann deshalb für Unternehmen völlig neue Zielgruppen erschließen. Wenn automatische Übersetzungen grammatisch korrekt und leicht verständlich sind, wird es für Unternehmen einfacher, Kunden auf der ganzen Welt zu finden. Mit Übersetzungen in Echtzeit sind Unternehmen in der Lage, neue Produkte schneller in vielen Regionen einzuführen:

  • Updates und News stehen sofort allen Kunden in ihrer eigenen Sprache zur Verfügung.
  • Chatbots können Kundenanfragen rund um die Uhr und ohne Wartezeiten beantworten. Für ein globales Unternehmen mit Kunden aus aller Welt sind das entscheidende Vorteile – nicht nur bei der Kommunikation mit Kunden, sondern auch im B2B-Bereich.
  • Telefonanrufe werden in Echtzeit übersetzt. Skype bietet eine entsprechende Funktion in seiner Software an. Damit werden Meetings mit fremdsprachigen Geschäftspartnern ohne den Einsatz eines Dolmetschers möglich.
  • Sprachassistenten helfen dabei, den Überblick über die Datenflut zu behalten. Kennzahlen können mündlich und in Echtzeit abgefragt werden. Lange Recherchen und Übersetzungen entfallen.

KI-Systeme sind wesentlich besser in der Lage, zutreffende Prognosen abzugeben als der Mensch, wenn sie mit großen Mengen an Daten lernen können. Menschen verarbeiten Informationen auf grundlegend andere Art als Maschinen. Sie bewerten Informationen aufgrund ihres Vorwissens und setzen entsprechende Prioritäten. Die maschinelle Mustererkennung, die durch Big Data ermöglicht wird, macht hingegen den Weg frei für exaktere Vorhersagen. Damit ist KI ein wichtiges Werkzeug zur Gestaltung der Zukunft.

Was ist Natural Language Processing?

Menschliche Sprache funktioniert grundlegend anders als die Kommunikation zwischen Maschinen. Programmiersprachen eröffnen keine Interpretationsspielräume, vielmehr bestehen sie aus exakten Anweisungen. Jede natürliche Sprache hingegen verändert sich ständig. Das Vokabular variiert von Sprecher zu Sprecher. Begriffe können im Kern das Gleiche bedeuten, aber unterschiedlichen Stilebenen angehören, wie z. B. die Ausdrücke „Klo“ und „Toilette“. Oft sind Bezeichnungen auch nicht neutral, sondern drücken eine Wertung aus, wie z. B. „Köter“ für „Hund“.

junge Frau nutzt natural language processing Funktion auf Smartphone

NLP-Software muss daher in der Lage sein, diese Bedeutungsunterschiede zu erfassen und z. B. in einer Übersetzung adäquat wiederzugeben. Das Gleiche gilt für grammatische Strukturen, die von einem NLP-Programm verstanden werden müssen. Lange komplizierte Sätze erfordern oft ein gewisses Weltwissen, um richtig verstanden zu werden. Dieses Nichtwissen muss die KI durch andere Techniken wie Mustererkennung kompensieren. Die folgenden Bereiche stellen dabei für NLP-Systeme eine besondere Herausforderung dar:

  • Eigennamen, z. B. von Orten, Personen und Organisationen: Da bestimmte Eigennamen möglicherweise nicht oder nicht sehr häufig vorkommen, muss die Zuordnung anhand anderer Kriterien erfolgen.
  • Emotionale Färbung von Äußerungen: Oft werden mit Aussagen auch Gefühle transportiert, die wichtiger Bestandteil des Gesagten sind.
  • Erfassung der Textsorte: Eine Einkaufsliste muss anders übersetzt und interpretiert werden als Stichpunkte für eine Präsentation oder ein Gedicht. Für bestimmte Textarten erwarten Leser ein bestimmtes Vokabular, z. B. ist ein Wikipedia-Artikel neutraler verfasst als ein Werbetext. Werden diese Konventionen nicht eingehalten, kann das zu Missverständnissen führen.
  • Beziehung von Personen in einem Text: Ein Gespräch zwischen Eheleuten muss unter Umständen anders übersetzt werden als ein Gespräch zwischen Geschäftspartnern, selbst wenn wortwörtlich das Gleiche gesagt wird. Im Deutschen ist hierbei die angemessene Verwendung der Anreden „du“ und „Sie“ oft ein wichtiges Element einer sinnvollen Übersetzung.

Natural Language Processing ist eine wichtige Schnittstelle zwischen Menschen und Computern. Sie erlaubt die barrierefreie Kommunikation und erleichtert so die Nutzung von intelligenten Maschinen.

Neue Chancen nutzen

Technologien wie Natural Language Processing und Machine Learning anhand von Big Data bieten für Unternehmen völlig neue Chancen mit ihren Kunden und Geschäftspartnern in Kontakt zu treten. Aber die Möglichkeiten gehen weit darüber hinaus. Durch die Bedienung von Computern mit natürlicher Sprache haben Nutzer Zugriff auf das volle Potenzial von KI-Technologie. Arbeitsaufgaben können so effektiver und effizienter erledigt werden. Ebenso erleichtern exaktere und einfacher zugängliche Prognosen die Entwicklung von Innovationen, die der Kern jedes unternehmerischen Erfolgs sind. Für die Umsetzung sollten Sie Partnerunternehmen wie z. B. Lionbridge hinzuziehen, die sich auf Sprachdienstleistungen und künstliche Intelligenz spezialisiert haben. Gerne beraten wir Sie.

#big data #big data anwendungsbereiche #big data und ki #machine learning #natural language processing #nlp definition