Natural Language Understanding (NLU)
Was ist Natural Language Understanding (NLU)?
Natural Language Understanding (NLU) ist ein Teilgebiet der künstlichen Intelligenz (KI), das mithilfe von Computersoftware Eingaben in Form von Sätzen in Text- oder Sprachform versteht. Natural Language Understanding, also das Verständnis natürlicher Sprache, ermöglicht die Interaktion zwischen Mensch und Computer, indem die Sprache im Gegensatz zu nur Wörtern analysiert wird.
NLU ermöglicht es Computern, die in einer natürlichen Sprache, wie zum Beispiel Deutsch, Englisch oder Französisch, ausgedrückten Gefühle zu verstehen, ohne die formalisierte Syntax von Computersprachen zu verwenden. Natural Language Understanding ermöglicht es Computern auch, mit Menschen in ihrer eigenen Sprache zu kommunizieren.
Eine grundlegende Form der NLU ist das sogenannte Parsing, bei dem geschriebener Text in ein strukturiertes Format umgewandelt wird, das Computern verstehen können. Anstatt sich auf die Syntax der Computersprache zu verlassen, ermöglicht NLU einem Computer, von Menschen geschriebenen Text zu verstehen und darauf zu reagieren.
Eines der Hauptziele von NLU ist die Entwicklung von Chat- und sprachgesteuerten Bots, die ohne Aufsicht mit Menschen interagieren. Viele Start-ups sowie große IT-Unternehmen wie Amazon, Apple, Google und Microsoft haben bereits NLU-Projekte und Sprachmodelle oder arbeiten daran.
Warum ist Natural Language Understanding wichtig?
Die menschliche Sprache ist für Computer in der Regel schwer zu verstehen, da sie voller komplexer, subtiler und sich ständig ändernder Bedeutungen ist. Systeme zum Verständnis natürlicher Sprache ermöglichen es Organisationen, Produkte oder Tools zu entwickeln, die sowohl Wörter verstehen als auch deren Bedeutung interpretieren können.
NLU ermöglicht es, einen Dialog mit einem Computer in einer menschlichen Sprache zu führen. Dies ist nützlich für Produkte oder Gerätefunktionen wie Sprachassistenten und die Umwandlung von Sprache in Text.
Wie funktioniert Natural Language Understanding?
Die NLU-Software analysiert Daten, um ihre Bedeutung zu ermitteln, indem sie Algorithmen verwendet, um menschliche Sprache in eine strukturierte Ontologie zu reduzieren – ein Datenmodell, das aus semantischen und pragmatischen Definitionen besteht. Zwei grundlegende Konzepte des NLU sind die Erkennung von Absichten und Entitäten:
- Die Intentionserkennung ist der Prozess, bei dem die Stimmung des Benutzers im eingegebenen Text identifiziert und sein Ziel bestimmt wird. Sie ist der erste und wichtigste Teil des NLU, da sie die Bedeutung des Textes festlegt.
- Die Entitätenerkennung ist eine spezielle Art des NLU, die sich auf die Identifizierung der Entitäten in einer Nachricht und die anschließende Extraktion der wichtigsten Informationen über diese Entitäten konzentriert. Es gibt zwei Arten von Entitäten: benannte Entitäten und numerische Entitäten. Benannte Entitäten werden in Kategorien eingeteilt, wie zum Beispiel Personennamen, Firmennamen und Orte. Numerische Entitäten werden als Mengen, Daten, Währungen und Prozentsätze erkannt.
Bei einer Eingabe in natürlicher Sprache teilt die NLU-Software diese Eingabe in einzelne Wörter auf, die als Token bezeichnet werden und Interpunktions- und andere Symbole enthalten. Die Tokens werden durch ein Wörterbuch geführt, das ein Wort und seine Wortart identifizieren kann. Die Tokens werden dann auf ihre grammatikalische Struktur hin analysiert, einschließlich der Wortrolle und verschiedener möglicher Bedeutungsmehrdeutigkeiten.
Wenn Sie beispielsweise in eine Suchmaschine die Anfrage nach einem Campingurlaub auf Sardinien am 18. August eingeben, kann dies wie folgt aufgeschlüsselt werden:
- Benötigte Fährtickets [Absicht]
- Campingplatzreservierung [Absicht]
- Sardinien [Ort]
- 18. August [Datum]
In diesem Fall hat die Person wahrscheinlich die Absicht, Tickets zu kaufen, und die Fähre ist die wahrscheinlichste Form der Reise, da sich der Campingplatz auf einer Insel befindet. Die Suchergebnisse einer NLU-fähigen Suchmaschine zeigen dann wahrscheinlich den Fahrplan und Links zum Kauf von Tickets an, da der Prozess die ursprüngliche Eingabe in einen Bedarf, einen Ort, eine Absicht und eine Zeit aufschlüsselte, damit das Programm die Eingabe verstehen konnte. Sardinien ist die benannte Entität und der 18. August ist die numerische Entität.

NLU versus NLP versus NLG
NLU ist eine Teilmenge des Natural Language Processing (NLP). NLP versucht, den Text eines bestimmten Dokuments zu analysieren und zu verstehen, und NLU ermöglicht es, einen Dialog mit einem Computer in natürlicher Sprache zu führen.
Während beide die menschliche Sprache verstehen, kommuniziert NLU mit ungeschulten Personen, um deren Absicht zu lernen und zu verstehen. Neben dem Verstehen von Wörtern und der Interpretation von Bedeutungen ist NLU so programmiert, dass es Bedeutungen trotz häufiger menschlicher Fehler wie falscher Aussprache oder vertauschter Buchstaben und Wörter versteht.
Die andere Untergruppe von NLP ist Natural Language Generation (NLG). NLG-Systeme ermöglichen es Computern, automatisch Texte in natürlicher Sprache zu generieren, indem sie die Art und Weise nachahmen, wie Menschen auf natürliche Weise kommunizieren – eine Abkehr vom traditionellen computergenerierten Text.

Im Allgemeinen fehlt computergenerierten Inhalten die Flüssigkeit, Emotionalität und Persönlichkeit, die von Menschen erstellte Inhalte interessant und ansprechend machen. NLG kann jedoch zusammen mit NLP verwendet werden, um menschenähnliche Texte zu erstellen, die einem menschlichen Autor nachempfunden sind. Dazu wird das Hauptthema eines Dokuments identifiziert und dann mithilfe von NLP die am besten geeignete Art und Weise ermittelt, das Dokument in der Muttersprache des Benutzers zu verfassen. Auf der Grundlage dieser Entscheidung wird der Text generiert.
So kann ein Computer beispielsweise mithilfe von NLG automatisch einen Nachrichtenartikel auf der Grundlage einer Reihe von Daten erstellen, die zu einem bestimmten Ereignis gesammelt wurden, oder ein Werbeprospekt zu einem bestimmten Produkt auf der Grundlage einer Reihe von Produktattributen verfassen.
Anwendungen für Natural Language Understanding
Die folgenden Anwendungen sind darauf ausgelegt, Sprache so zu verstehen, wie es Menschen tun, und nicht nur eine Liste von Schlüsselwörtern:
- Interaktive Sprachausgabe (Interactive Voice Response, IVR) und Nachrichtenweiterleitung. IVR wird für Self-Service und Anrufweiterleitung verwendet. Die ersten Versionen waren ausschließlich mit Tonwahl ausgestattet und beinhalteten keine KI. Mit der Weiterentwicklung der IVR-Technologie wurden jedoch Funktionen wie NLP und NLU eingeführt, sodass Benutzer per Spracheingabe mit dem Telefonsystem interagieren können. Das System verarbeitet die Stimme des Benutzers, wandelt die Wörter in Text um und analysiert dann die grammatikalische Struktur des Satzes, um die wahrscheinliche Absicht des Anrufers zu ermitteln.
- Kundenservice durch intelligente persönliche Assistenten. NLU ist die Technologie hinter Chatbots, das heißt Computerprogrammen, die sich mit einem Menschen in natürlicher Sprache per Text oder Sprache unterhalten. Diese intelligenten persönlichen Assistenten sind eine nützliche Ergänzung des Kundenservices. Chatbots werden beispielsweise eingesetzt, um Antworten auf häufig gestellte Fragen zu geben. Um dies zu erreichen, sind in der NLU-Technologie mehrere Ebenen verschiedener Prozesse erforderlich, wie zum Beispiel Merkmalsextraktion und -klassifizierung, Verknüpfung von Entitäten und Wissensmanagement.
- Stimmung und Absicht des Benutzers. Unternehmen können NLU zur Analyse der Kundenstimmung und -absicht einsetzen. So kann NLU beispielsweise ein Unternehmen dabei unterstützen, mehrere Kommentare in sozialen Medien zu analysieren, um festzustellen, ob die Kunden dem Unternehmen oder einem angebotenen Produkt mehrheitlich positiv oder negativ gegenüberstehen. NLU kann Begriffe und Phrasen erfassen und verstehen, die in die Suchleiste einer Website eingegeben werden, um die Absicht eines Kunden beim Navigieren auf seiner Website besser zu verstehen.
- Maschinelle Übersetzung. Maschinelles Lernen ist ein KI-Teilgebiet, das es Computern ermöglicht, auf der Grundlage von Trainingsdaten zu lernen und ihr Verhalten zu ändern. Algorithmen für maschinelles Lernen werden auch verwendet, um von Grund auf neuen Text in natürlicher Sprache zu generieren. Im Falle der Übersetzung analysiert ein Algorithmus für maschinelles Lernen Millionen von Textseiten, wie zum Beispiel Verträge oder Finanzdokumente, um zu lernen, wie man sie in eine andere Sprache übersetzt. Je mehr Dokumente analysiert werden, desto genauer ist die Übersetzung. Wenn ein Benutzer beispielsweise Daten mit einem automatischen Sprachwerkzeug wie einem Wörterbuch übersetzt, wird eine Wort-für-Wort-Ersetzung durchgeführt. Bei der maschinellen Übersetzung werden die Wörter jedoch im Kontext nachgeschlagen, was zu einer genaueren Übersetzung führt.
- Datenerfassung. Bei der Datenerfassung werden Informationen über ein Objekt, eine Person oder ein Ereignis gesammelt und aufgezeichnet. Wenn ein E-Commerce-Unternehmen beispielsweise NLU einsetzt, kann es Kunden bitten, ihre Versand- und Rechnungsinformationen mündlich einzugeben. Die Software versteht, was der Kunde sagt, und die Informationen werden automatisch eingeben.
- Dialogschnittstellen. Viele Geräte mit Sprachsteuerung, darunter Amazon Alexa und Google Home, ermöglichen es Benutzern, auf natürliche Weise zu sprechen. Durch den Einsatz von NLU können Dialogschnittstellen die menschliche Sprache verstehen und darauf reagieren, indem sie Wörter und Sätze segmentieren, Grammatik erkennen und semantisches Wissen nutzen, um Absichten abzuleiten.