Definition

Automatische Spracherkennung (ASR)

Bei der automatischen Spracherkennung (Automated Speech Recognition, ASR) handelt es sich um eine Technologie, die es den Benutzern von Informationssystemen ermöglicht, Eingaben zu sprechen, anstatt Zahlen auf einer Tastatur einzugeben. ASR wird in erster Linie zur Auskunftserteilung und zur Weiterleitung von Telefonanrufen eingesetzt.

ASR hat sich in den Kundendienstabteilungen großer Unternehmen durchgesetzt. Sie wird auch von einigen Behörden und anderen Organisationen genutzt. Einfache ASR-Systeme erkennen Ein-Wort-Eingaben wie Ja-oder-Nein-Antworten und gesprochene Ziffern. Auf diese Weise können sich Mitarbeiter durch automatisierte Menüs arbeiten, ohne Dutzende von Ziffern manuell eingeben zu müssen, ohne dass eine Fehlertoleranz besteht. Bei der manuellen Eingabe kann es vorkommen, dass ein Kunde die falsche Taste drückt, nachdem er zuvor 20 oder 30 Ziffern in verschiedenen Abständen in das Menü eingegeben hat, und dann lieber aufgibt, als noch einmal anzurufen und von vorne zu beginnen. Mit ASR wird dieses Problem praktisch eliminiert.

Hochentwickelte ASR-Systeme ermöglichen es dem Benutzer, direkte Anfragen oder Antworten einzugeben, zum Beispiel die Frage nach einer Wegbeschreibung oder die Telefonnummer eines Hotels in einer bestimmten Stadt. Dies verkürzt den Prozess der Menüführung, da die Anzahl der Entscheidungspunkte reduziert wird. Außerdem wird die Anzahl der Anweisungen reduziert, die der Benutzer erhalten und verstehen muss.

Für Institutionen, die stark auf den Kundenservice angewiesen sind, wie Fluggesellschaften und Versicherungen, ermöglicht ASR die Reduzierung der Anzahl menschlicher Mitarbeiter in Call Centern. Diese Mitarbeiter können dann für andere, profitablere und interessantere Aufgaben geschult werden, beispielsweise für die Bearbeitung von Beschwerden, die Kundenbindung oder den Verkauf.

Die Technologie der Spracherkennung gibt es schon seit einiger Zeit. Sie wird immer besser, aber es gibt nach wie vor Probleme. Ein ASR-System kann die Eingaben einer Person, die mit starkem Akzent oder Dialekt spricht, nicht immer richtig erkennen, und es hat große Probleme mit Menschen, die aus Gewohnheit Wörter aus zwei Sprachen kombinieren. Schlechte Mobilfunkverbindungen können dazu führen, dass das System die Eingaben falsch interpretiert. Und obwohl die Kosten allmählich sinken, sind ASR-Systeme für einige Unternehmen immer noch zu teuer.

Diese Definition wurde zuletzt im April 2022 aktualisiert

Erfahren Sie mehr über Unified Communications

ComputerWeekly.de
Close