Intent- und Entity-Erkennung in Conversational-Systemen: Herausforderungen und Lösungen für eine präzise Nutzerinteraktion

Für die Automatisierung der Service- und Kommunikationsprozesse im Service-Center und in Conversational-Projekten spielt die präzise Erkennung von Anliegen und ihren spezifischen Hintergründen eine entscheidende Rolle für die Qualität der Kundeninteraktion. Hier unterscheiden sich bisher der Mensch und die „unintelligente“ Maschine – während der Mensch prinzipiell in der Lage ist, bei unvollständiger Information auf unterschiedliche und situationsgerechte Weise nachzufragen und sowohl das Anliegen als auch die Hintergründe zu „entschlüsseln“, stoßen die bisherigen „unintelligenten“ Maschinen oft an ihre Grenzen.

Als „unintelligent“ verstehen wir hierbei „regelbasierte“ Systeme, die auf Wenn-Dann-Regeln basieren, um Informationen zu entschlüsseln. Moderne Conversational AI-Ansätze sind hier bereits ein Stück weiter und können auf verschiedene Anliegen in unterschiedlichen Kontexten trainiert werden, haben aber auch hier, je nach Trainingsqualität, ihre Grenzen. Das klare Verständnis und die genaue Definition der Anliegen und der Kontexte, auf die die Maschinen reagieren sollen, sind eine zentrale Aufgabe im Service- wie auch im Conversational Design-Prozess.

Die Differenzierung zwischen dem „Intent“, also dem Anliegen oder der Absicht des Nutzers, und der „Entity“, dem spezifischen Kontext oder Detail, das den Prozess betrifft, ist hierbei ein wichtiger Schritt und ermöglicht es, Nutzeranfragen zielgerichtet und effektiv zu bearbeiten. Gleichzeitig gibt es jedoch mehrere Herausforderungen, die bei der Implementierung dieser Erkennungen zu beachten sind. Dieser Beitrag beleuchtet die Bedeutung dieser Unterscheidung, ihre praktische Anwendung und die damit verbundenen Herausforderungen.

Intent als abstraktes Anliegen

Der „Intent“ im Service- und Conversational-Design ist das übergeordnete Anliegen oder die Absicht, die ein Benutzer mit einer bestimmten Aussage oder Frage verfolgt. Es ist das, was der Benutzer erreichen möchte – wie z. B. „Wetter abfragen“, „Produkt suchen“, „Service-Mängel melden“ oder „Musik abspielen“. Intents helfen dem System zu verstehen, was der Benutzer tun möchte.

Im Kontext von geschäftlichen Anwendungen sind „Intents“ im weitesten Sinne Prozessanliegen und kennzeichnen sich durch folgende Merkmale:

Fokus auf das Ziel: Der Intent repräsentiert das übergeordnete Ziel oder Anliegen des Nutzers, das in einem Satz oder einer Anfrage formuliert wird.
Prozesssteuerung: Der Intent steuert den gesamten weiteren Prozess der Interaktion, indem er das System auf die gewünschte Richtung der Lösung hinweist.
Priorisierung: Systeme können verschiedene Intents priorisieren, um dringende Anliegen schneller zu bearbeiten.

Entität als Kontextelement des Anliegens

Eine „Entität“ definiert eine inhaltliche Besonderheit bzw. eine beschreibende Kontextinformation, die das Anliegen spezifiziert und welche für die Erfüllung des Intents relevant ist. Es kann ein Ort, eine Person, eine Zahl, ein Produkt oder ein anderes spezifisches Objekt sein. So z. B. bei der „Wetterabfrage“ – der Ort und die zeitliche Dimension (heute, morgen oder ein Datum in der Zukunft).

Die Entität liefert die Detailinformation, um den Intent zu bearbeiten. Je nach Intent ist die Erkennung von Entitäten förderlich oder zwingend. Im Falle einer „Begrüßung“ braucht es per se keine Entität, aber durch eine „Namensidentifikation“ oder „Geschlechterspezifikation“ ist die Begrüßung individueller und damit qualitativ hochwertiger bzw. „erlebnisreicher“ zu gestalten. Für die oben angeführte „Wetterabfrage“ sind die Orts- und Zeitangaben jedoch erforderlich. Im Kontext der Geschäftsprozesse haben die Entitäten folgende Besonderheiten zu erfüllen:

Präzision: Die Entity muss genau erkannt werden, um die richtige Information oder den richtigen Service bereitzustellen.
Relevanz: Die Entity sollte immer im direkten Zusammenhang mit dem Intent stehen, um die Nutzeranfrage sinnvoll zu bearbeiten.
Vielseitigkeit: Verschiedene Ausdrücke oder Formate für die gleiche Entity müssen erkannt und richtig zugeordnet werden.

Utterances als Ausdrücke der Nutzerabsicht

„Utterances“ sind die konkreten Aussagen oder Anfragen, die Nutzer an die Systeme richten, um ihre Intents und die damit verbundenen Entitäten auszudrücken. Sie stellen die sprachliche Vielfalt dar, in der Nutzer ihre Anliegen formulieren, und sind somit der Schlüssel für die Erkennung und Bearbeitung von Intents und Entities. Utterances können in vielen Variationen vorkommen, was die Entwicklung eines robusten Erkennungssystems herausfordernd macht.

Die Umwandlung einer natürlichen Sprachäußerung (Utterance) in einen verständlichen Befehl für eine Maschine ist ein komplexer Prozess, der im Kern der Conversational AI liegt. Hierbei spielen Intents und Entitäten eine entscheidende Rolle. Verschiedene technologische Methoden kommen zum Einsatz, um diesen Prozess zu unterstützen:

Natürliche Sprachverarbeitung (Natural Language Processing, NLP): NLP-Techniken analysieren die Utterances, um sprachliche Strukturen zu erkennen und daraus Intents und Entities abzuleiten. Dies umfasst die Syntaxanalyse, semantische Analyse und das maschinelle Lernen, um die Bedeutung hinter den Wörtern zu erfassen.
Kontextuelle Analyse: Utterances werden im Kontext vorheriger Interaktionen analysiert, um Missverständnisse zu vermeiden und die Nutzerabsicht präziser zu interpretieren. Dies ist besonders wichtig, wenn die Utterance mehrdeutig ist oder sich auf frühere Konversationen bezieht.
Machine Learning und Trainingsdaten: Systeme werden mit umfangreichen Trainingsdaten gefüttert, um eine Vielzahl von Utterances zu erkennen und zu interpretieren. Das kontinuierliche Training und die Anpassung des Systems an neue Sprachmuster und Ausdrucksweisen verbessern die Genauigkeit der Erkennung im Laufe der Zeit.

Ein tiefes Verständnis und die effiziente Bearbeitung von Utterances sind entscheidend, um die Intent- und Entity-Erkennung in Conversational-Systemen zu verbessern und die Interaktion mit den Nutzern reibungslos und intuitiv zu gestalten. Solche Systeme müssen in der Lage sein, die vielfältigen Ausdrucksweisen der Nutzer zu erfassen und angemessen darauf zu reagieren, um eine hohe Qualität der Benutzerinteraktion sicherzustellen.

Herausforderungen bei der Intent- und Entity-Erkennung

Die Implementierung der Intent- und Entity-Erkennung ist mit mehreren Herausforderungen verbunden, die die Leistung und Genauigkeit der verarbeitenden Systeme erheblich beeinflussen können. Diese Herausforderungen sind zentral für die Entwicklung von Conversational-Systemen, die effektiv und zuverlässig auf Nutzeranfragen reagieren sollen.

Ambiguität in der Sprache

Problem: Die natürliche Sprache ist oft mehrdeutig. Ein einzelner Satz kann mehrere potenzielle Intents oder Entities beinhalten, was die korrekte Erkennung erschwert. Zum Beispiel könnte der Satz „Ich möchte mein Konto schließen“ sowohl eine einfache Kontoschließung als auch den Wunsch nach einem Wechsel zu einem anderen Anbieter implizieren.
Lösung: Der Einsatz von Kontextinformationen und fortgeschrittenen NLP-Modellen (Natural Language Processing) kann helfen, Ambiguitäten zu reduzieren. Kontextuelle Modelle berücksichtigen frühere Interaktionen und den aktuellen Gesprächsverlauf, um die genaue Bedeutung einer Äußerung zu ermitteln.

Jetzt für Newsletter registrieren!
Erhaltet jeden Monat wichtige Impulse für Euer CX-Projekt mit unserem Newsletter!

Vielzahl an Ausdrucksweisen

Problem: Nutzer drücken ihre Anliegen auf vielfältige Weise aus. Ein Intent wie „Flug buchen“ könnte durch verschiedene Formulierungen geäußert werden, z. B. „Ich brauche einen Flug“, „Kannst du mir ein Ticket reservieren?“ oder „Ich möchte reisen“. Diese Variabilität stellt eine Herausforderung dar, da das System in der Lage sein muss, alle möglichen Formulierungen abzudecken.
Lösung: Maschinenlernmodelle, die auf umfangreichen und vielfältigen Datensätzen trainiert werden, sind besser in der Lage, diese Vielfalt zu handhaben. Solche Modelle können unterschiedliche Ausdrucksweisen eines Intents erkennen und korrekt zuordnen, was die Flexibilität und Genauigkeit des Systems erhöht.

Kontextsensitive Entity-Erkennung

Problem: Entities können in unterschiedlichen Kontexten unterschiedliche Bedeutungen haben. Beispielsweise kann „Paris“ je nach Kontext als Reiseziel, Nachname oder sogar als Event-Ort interpretiert werden. Die Herausforderung besteht darin, den richtigen Kontext zu identifizieren, um die Entity korrekt zu verstehen und entsprechend zu handeln.
Lösung: Die Kombination von Entity-Erkennung mit einer starken Kontextanalyse, die sowohl frühere Dialoge als auch aktuelle Anfragen berücksichtigt, kann die Genauigkeit der Erkennung erheblich steigern.

Skalierbarkeit und Wartung

Problem: Das Erstellen und Pflegen eines umfangreichen Satzes an Intents und Entities erfordert erhebliche Ressourcen. Da sich Benutzergewohnheiten und Sprache im Laufe der Zeit verändern, muss das System kontinuierlich aktualisiert werden, um relevant und effektiv zu bleiben.
Lösung: Automatisierte Lernprozesse und eine kontinuierliche Datenanalyse können dazu beitragen, die Systeme dynamisch und effizient anzupassen. Dadurch werden aufwendige manuelle Aktualisierungen minimiert, und das System bleibt stets auf dem neuesten Stand.

Fehlerbehandlung und Robustheit

Problem: Fehler in der Intent- oder Entity-Erkennung können zu Fehlinterpretationen führen, die das Benutzererlebnis negativ beeinflussen. Ein Missverständnis des Intents könnte das System beispielsweise dazu veranlassen, eine falsche Aktion auszuführen, was die Zufriedenheit des Nutzers beeinträchtigen kann.
Lösung: Systeme sollten so konzipiert sein, dass sie Fehler erkennen und korrigieren können. Dies kann durch gezieltes Nachfragen oder durch Bestätigungen geschehen, um sicherzustellen, dass die Benutzeranfrage korrekt verstanden wurde, bevor eine Aktion ausgeführt wird.

Diese Herausforderungen zeigen, wie komplex die Entwicklung und Implementierung von Conversational-Systemen ist. Die Bewältigung dieser Probleme ist entscheidend für die Schaffung eines Systems, das präzise, zuverlässig und benutzerfreundlich ist.

Fazit: Präzise Erkennung und kontinuierliche Optimierung

Die präzise Unterscheidung und Erkennung von Intents und Entities ist essenziell für die Entwicklung moderner Service-Automation- und Conversational-Systeme. Sie ermöglicht es, Nutzeranfragen effektiv zu verstehen und zielgerichtet zu bearbeiten, was die Qualität der Kundeninteraktion entscheidend verbessert. Gleichzeitig sind die Herausforderungen, die mit der Ambiguität der natürlichen Sprache, der Vielfalt der Ausdrucksweisen, der kontextsensitiven Entity-Erkennung sowie der Skalierbarkeit und Fehlerbehandlung einhergehen, nicht zu unterschätzen.

Im Wechselspiel mit den Möglichkeiten der Generativen KI lassen sich zudem neue Möglichkeiten für das Design und die Optimierung dieser Lösungen erschließen. Insgesamt ist aber festzuhalten, dass erfolgreiche Ansätze eine sorgfältige Planung, den Einsatz fortgeschrittener NLP-Modelle und eine kontinuierliche Optimierung erfordern. Damit legen sie die Grundlage für eine verbesserte Kundenzufriedenheit und eine effizientere Prozessautomatisierung im Servicebereich.

Jetzt kostenlos für Freemium-Zugang zur Shift/CX-Plattform registrieren!

Zugang zu Freemium-Inhalten der Mediathek
Drei Credits für Freischaltung von Premium-Inhalten
Monatlicher Content-Newsletter mit Premium-Inhalten
Zugang zu geschlossener Linkedin-Gruppe
Besondere Plattform-Angebote über Shift/CX Updates
Kostenlos für immer!

Transparenzhinweis:
Wir legen großen Wert auf sachliche und unabhängige Beiträge. Um nachvollziehbar zu machen, unter welchen Rahmenbedingungen unsere Inhalte entstehen, geben wir folgende Hinweise:

Partnerschaften: Vorgestellte Lösungsanbieter können Partner oder Sponsoren unserer Veranstaltungen sein. Dies beeinflusst jedoch nicht die redaktionelle Auswahl oder Bewertung im Beitrag.
Einsatz von KI-Tools: Bei der Texterstellung und grafischen Aufbereitung unterstützen uns KI-gestützte Werkzeuge. Die inhaltlichen Aussagen beruhen auf eigener Recherche, werden redaktionell geprüft und spiegeln die fachliche Einschätzung des Autors wider.
Quellenangaben: Externe Studien, Daten und Zitate werden transparent kenntlich gemacht und mit entsprechenden Quellen belegt.
Aktualität: Alle Inhalte beziehen sich auf den Stand zum Zeitpunkt der Veröffentlichung. Spätere Entwicklungen können einzelne Aussagen überholen.
Gastbeiträge und Interviews: Beiträge von externen Autorinnen und Autoren – etwa in Form von Interviews oder Gastbeiträgen – sind klar gekennzeichnet und geben die jeweilige persönliche Meinung wieder.

Inhaltsverzeichnis

Suche

Jetzt Freemium-Mitgliedschaft registrieren & kostenlos auf Mediathek zugreifen!

Top Themen

Messenger, Chatbots & Conversational Experiences

Digital Experience & Commerce Management

Customer Service & Contact Center Management

Purpose	Lifetime	Type
Saves your consent to using cookies.	1 year	HTML
Assigns your browser to a session on the server.	session	HTTP
Dieser temporäre Cookie wird zur Personalisierung Ihres Benutzererlebnisses gesetzt.	1 year	HTTP
This temporary cookie is set to by our webchat solution Social Intents.	1 session	HTTP
This temporary cookie is set to by our webchat solution Social Intents.	1 session	HTTP
This temporary cookie is set to by our webchat solution Social Intents.	1 session	HTTP
Notwendig für die Vimeo-Video-Einbindung - Videos werden mit Do Not Track Parameter eingebunden!	1 year	HTML

Purpose	Lifetime	Type
Dieser temporäre Cookie wird durch Mautic gesetzt - einer selbst-gehosteten Marketing Automation Loesung. Die Cookie-Daten helfen bei der Personalisierung der Kundenansprache.	1 year	HTML
Dieser temporäre Cookie wird durch Mautic gesetzt - einer selbst-gehosteten Marketing Automation Loesung. Die Cookie-Daten helfen bei der Personalisierung der Kundenansprache.	1 year	HTML
Dieser temporäre Cookie wird durch Mautic gesetzt - einer selbst-gehosteten Marketing Automation Loesung. Die Cookie-Daten helfen bei der Personalisierung der Kundenansprache.	1 year	HTML
Dieser temporäre Cookie wird zur Personalisierung Ihres Benutzererlebnisses gesetzt.	1 session	HTTP
Notwendig für die Vimeo-Video-Einbindung - Videos werden mit Do Not Track Parameter eingebunden!	1 year	HTML

Mediathek mit allen Videos

Fachbeiträge zur Customer Experience

Downloads & Whitepaper

Mediathek-Serien im Überblick

Knowhow & Glossar

LinkedIn Community

Shift/CX Convention

Shift/CX Marketing Automation Konferenz

Mediathek-Serie zur Shift/CX Konferenz 2025

Mediathek-Serie: Shift/CX Trends 2025

Shift/CX Experience Marketing Blog

Fachbeiträge, Interviews & Aktuelles zum Customer Experience Management