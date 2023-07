Vorurteile und Fehler sind nicht nur menschlich, sondern auch Eigenschaften von schlecht trainierten KI-Anwendungen. Doch wie kommt es dazu und warum sollte sich die IT darum kümmern?

Eine kurze Einführung in KI-Lernmodelle

Um zu verstehen, wie Verzerrungen bei künstlicher Intelligenz entstehen, hilft ein Blick auf die drei grundlegenden Trainingsmethoden:

Überwachtes Lernen

Die Eingabedaten sind mit einer Art Etikett versehen. Dadurch weiß das KI-System, wie auf Basis des Datensatzes und der Kennzeichnungen die Ausgabe aussehen sollte. Es nutzt dieses Wissen, um andere Werte vorherzusagen. Innerhalb dieser Kategorie gibt es zwei Haupttypen von Algorithmen. Einer basiert auf Klassifizierung, wobei die Daten anhand von Attributen wie Farbe, Größe und Form in Kategorien eingeteilt werden. Häufige Anwendungen dafür sind die Erkennung von Bildern oder Spam sowie die Filterung von E-Mails. Der andere Typ verwendet mathematische Regression, um Muster zu erkennen, die auf einer linearen Beziehung zwischen Eingabe und Ausgabe beruhen. Hier wird die Ausgabe außerhalb des Modells kategorisiert. Diese Methode wird oft für Markttrends oder Wettervorhersagen eingesetzt.

Unüberwachtes Lernen

Das KI-System erhält keine Hinweise auf die Art der Daten. Es soll selbst Muster und Beziehungen erkennen und ein Ergebnis ermitteln. Unüberwachte Lernalgorithmen stützen sich auf zwei Techniken: Clusterung und Assoziation. Bei der Clusterung teilt das System Daten auf der Grundlage von Ähnlichkeiten so in Gruppen auf, dass diese nur wenige oder keine Ähnlichkeiten mit anderen Gruppen aufweisen. So lässt sich etwa das Kaufverhalten von Kunden analysieren. Bei der Assoziation soll das System Beziehungen zwischen Daten finden, zum Beispiel Abhängigkeiten. Hier geht es ausschließlich um Korrelation, nicht um Ursachen. Diese Methode kommt häufig bei Web Usage Mining zum Einsatz.

Verstärktes Lernen

Die Kombination von überwachtem und unüberwachtem Lernen soll die Nachteile beider Verfahren reduzieren. Hier erhalten die Systeme unbeschriftete Daten, die sie untersuchen. Ihre Ergebnisse werden dann von Menschen positiv oder negativ bewertet. So lernt das System, seine Entscheidungen zu verbessern. Dieses Modell entspricht am ehesten dem menschlichen Lernen, wie in der Schule. Häufige Anwendungen sind Videospiele, Robotik und Textmining.