Definition

Bestärkendes Lernen (Reinforcement Learning)

Bestärkendes Lernen oder verstärkendes Lernen (Reinforcement Learning) ist eine Trainingsmethode, die auf die Belohnung erwünschter Verhaltensweisen und/oder der Bestrafung unerwünschter Verhaltensweisen setzt. Bestärkendes Lernen wurde im Bereich der künstlichen Intelligenz (KI) als eine Methode zur Steuerung des unbeaufsichtigten maschinellen Lernens durch Belohnungen und Strafen übernommen.

Bestärkendes Lernen wird in den Bereichen Operations Research, Informationstheorie, Spieltheorie, Kontrolltheorie, simulationsbasierte Optimierung, Multiagentensysteme, Schwarmintelligenz, Statistik und genetische Algorithmen eingesetzt.

Im Gegensatz zu überwachten Lernalgorithmen, die typischerweise mit einem Set bekannter und korrekter Antworten trainiert werden, lernt ein Agent bei einem nicht überwachten Training durch Verstärkung. Ein Agent, der sich durch Verstärkung etwas aneignet, lernt von der Umgebung, in der er seine Aufgabe ausführt.

Zunächst wird eine Methode zur Belohnung erwünschter Verhaltensweisen und zur Bestrafung negativer Verhaltensweisen entwickelt. Erwünschten Verhaltensweisen werden positive Werte zugewiesen, um positive Verstärkung zu bieten, und unerwünschten Verhaltensweisen werden negative Werte für negative Verstärkung zugewiesen.

Der Agent ist so programmiert, dass er eine langfristige und maximale Gesamtbelohnung anstrebt, um eine optimale Lösung zu erzielen. Langfristige Ziele verhindern, dass der Agent bei geringeren Zielen ins Stocken gerät, und vermeiden gleichzeitig Risiken.

Bemerkenswert ist auch die Hinzufügung von Mechanismen zur Förderung eines explorativen Verhaltens. Das Markov-Entscheidungsproblem wird zum Beispiel manchmal bei Explorationsentscheidungen verwendet, bei denen ein Agent eine Belohnung ignorieren kann, um etwas zu erforschen. Zu diesem Zweck können Entwickler einen Effekt wie Neugier hinzufügen, der bei der Erforschung hilft.

Da es auf dem Verständnis biologischer Systeme basiert, ist bestärkendes Lernen (Reinforcement Learning) ein Teil des bio-inspirierten Computings (Bio-inspired Computing). Als psychologisches Prinzip stammt bestärkendes Lernen aus der Schule der Verhaltenspsychologie.

Diese Definition wurde zuletzt im Mai 2020 aktualisiert

Erfahren Sie mehr über IT-Berufe und Weiterbildung

ComputerWeekly.de
Close