psdesign1 - Fotolia

3 Beispiele für die Fortschritte bei KI und Spracherkennung

Die Kombination von künstlicher Intelligenz und Spracherkennung hat fortschrittlicher Funktionen gebracht. Hier sind drei Anwendungen, die die Zukunft der Sprachtechnologie zeigen.

Sprachtechnologien sind schon seit einiger Zeit ausgereift, aber das Aufkommen von künstlicher Intelligenz (KI) hat zu einer dramatischen Innovation mit völlig neuen Anwendungen und Einsatzmöglichkeiten geführt. Die erzwungene Verlagerung auf Heimarbeit zu Beginn der COVID-19-Pandemie brachte neue Herausforderungen für die Kommunikation sowie Collaboration mit sich und beschleunigte die Entwicklung der Sprachtechnologie weiter.

Anbieter von Unified Communications (UC) haben darauf reagiert und KI-gesteuerte Funktionen wie Echtzeit-Transkription und -Übersetzung hinzugefügt. Diese neuen Funktionen wurden weithin angenommen, und die Mitarbeiter haben ein besseres Verständnis dafür, wie Sprachtechnologie ihre Produktivität steigern kann. Dies ist zwar eine begrüßenswerte Entwicklung, aber wir befinden uns immer noch im Anfangsstadium dessen, was mit KI und Spracherkennungstechnologie möglich ist.

Da es sich bei der KI um eine iterative Technologie handelt, sollten wir mit ständiger Innovation sowie neuen Möglichkeiten rechnen und nicht nur mit stetigen Verbesserungen. Lassen Sie uns drei Beispiele für die Zukunft der Sprachtechnologie in Unternehmen untersuchen.

1. Virtuelle Assistenten

Das Konzept der virtuellen Assistenten ist zwar nicht neu, aber es hat sich so weit entwickelt, dass jeder Mitarbeiter jetzt über das Äquivalent eines persönlichen Sekretärs verfügen kann, und das zu minimalen Kosten für das Unternehmen. Bis vor Kurzem basierten die Fähigkeiten virtueller Assistenten auf der Beantwortung einfacher Befehle oder strukturierter, geschlossener Fragen, ähnlich wie bei Amazon Alexa oder Apple Siri.

Diese Sprachassistenten boten eine sprachbasierte Alternative zur Tastatur, verfügten aber nicht über die Intelligenz, um über einfache Aufgaben wie das Tätigen eines Anrufs hinauszugehen. Die große Veränderung kommt mit der konversationellen KI, bei der Chatbots über genügend Intelligenz verfügen, um in einen zweiseitigen Dialog mit Arbeitnehmern einzutreten und sogar ein Gespräch zu initiieren.

Mit den heutigen Fortschritten in der KI lassen sich virtuelle Assistenten vollständig in Arbeitsplatzanwendungen integrieren, zum Beispiel in Kalender, E-Mail, Telefonie, Konferenzen, Workflow-Tools, Dokumente und Tabellenkalkulationen. Die Interaktion mit Sprachassistenten kann nun bei der Kalenderplanung und der Terminierung von Besprechungen dialogorientierter erfolgen.

Da die Spracherkennung inzwischen sehr genau ist, können digitale Assistenten zum Diktieren von Memos, zur Umwandlung von E-Mails in Sprache oder sogar zur Umwandlung von Voicemail-Nachrichten in Text verwendet werden. All diese Funktionen zusammengenommen heben den Wert digitaler Assistenten auf ein viel höheres Niveau.

2. Intelligente Zusammenfassungen von Meetings

Dies ist ein großartiges Beispiel dafür, wie KI einen neuen Geschäftswert schafft, der über die grundlegende Aufgabe der genauen Transkription des Gesagten hinausgeht. Die Spracherkennung ist recht einfach, wenn nur eine Person verfolgt wird. Aber bei Meetings ist eine zusätzliche Ebene der Sprechererkennung erforderlich, um zu verfolgen, was die einzelnen Personen sagen.

Die künstliche Intelligenz spielt eine Schlüsselrolle bei der genauen Verfolgung von Sprache und Sprechererkennung, was neue Möglichkeiten für eine effektivere Zusammenarbeit schafft. Wenn alle Gespräche während eines Meetings erfasst und richtig zugeordnet werden können, lassen sich die Gesprächsdatenströme mit Analysen in verwertbares Wissen umwandeln.

So können beispielsweise Besprechungstranskriptionen für Teammitglieder erstellt werden, die nicht an der Besprechung teilnehmen konnten, aber dennoch wissen müssen, was passiert ist, insbesondere zu Compliance-Zwecken. Während dies einen inhärenten Wert hat, fügt KI eine weitere Ebene hinzu, indem sie in der Lage ist, nur die Gespräche zu extrahieren, die für einen bestimmten Bedarf relevant sind, zum Beispiel für ein bestimmtes Projekt, eine bestimmte Person oder einen bestimmten Zeitraum.

Da es sich um Datenströme handelt, sind diese Unterhaltungen auch durchsuchbar. Durch die Verwendung von Schlüsselwörtern und Tags können die Mitarbeiter mithilfe von KI individuelle Zusammenfassungen von Besprechungen erstellen. Dies erspart den Mitarbeitern nicht nur die Zeit, sich eine komplette Aufzeichnung anzuhören, sondern ermöglicht es auch Teammitgliedern, die nicht an der Besprechung teilgenommen haben, sich weiter zu beteiligen. Mit der Weiterentwicklung der KI-Funktionen werden diese Zusammenfassungen auch Aktionspunkte enthalten, nicht nur solche, die explizit genannt werden, sondern auch solche, die sich aus dem Gespräch ergeben.

3. Biometrische Daten

Hierbei handelt es sich um einen aufstrebenden Bereich der Sprachtechnologie, in dem die Stimmbiometrie zur Authentifizierung verwendet werden kann, ähnlich wie ein Netzhaut-Scan oder ein Fingerabdruck. KI kann jetzt hochpräzise Stimmabdrücke erstellen, die als berührungslose Option zur Automatisierung von Aktivitäten dienen, zum Beispiel beim Betreten eines Raums, beim Beginn einer Besprechung oder beim Auslösen einer Finanztransaktion. Dies mag wie eine Kleinigkeit erscheinen, aber es spart Zeit, rationalisiert Prozesse und bietet eine weitere Sicherheitsebene, die es den Mitarbeitern erleichtert, ins Büro zurückzukehren.

In dem Maße, wie sich die Stimmbiometrie weiterentwickelt und zunehmend eingesetzt wird, bieten sie auch Vorteile für den Datenschutz und die Sicherheit. In einigen Kontaktzentren wird die Stimmbiometrie beispielsweise eingesetzt, um Missbrauch durch Betrüger zu verhindern, die versuchen, sich am Telefon als echte Kunden auszugeben.

Ähnliche Szenarien sind auch am Arbeitsplatz möglich, wo Außenstehende versuchen, über die Stimme Identitäten zu stehlen, auf Unternehmensdaten zuzugreifen, Gelder abzuzweigen oder den Betrieb zu stören. Telefonsysteme sind oft eine Schwachstelle im Sicherheitsbereich eines Unternehmens. Wenn sie einmal durchbrochen sind, können diese bösartigen Handlungen schnell folgen.

Erfahren Sie mehr über Collaboration-Software

ComputerWeekly.de
Close