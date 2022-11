KI-Projekte werden heute in vielen Branchen und für zahlreiche Anwendungen eingeführt. Zu diesen Anwendungen gehören zum Beispiel Predictive Analytics, Mustererkennungssysteme, autonome Systeme, Konversationssysteme, Hyperpersonalisierung und zielgerichtete Systeme.

So verschieden diese Projekte auf den ersten Blick erscheinen – sie haben doch etwas gemeinsam: Alle Anwendungsfelder basieren auf einem konkreten Geschäftsproblem und darauf, dass Daten und Machine-Learning-Algorithmen auf das Problem angewendet werden müssen. Das Ergebnis ist ein Modell für maschinelles Lernen, welches die Anforderungen des Projekts erfüllt.

Die Bereitstellung und Verwaltung von Machine-Learning-Projekten erfolgt in der Regel nach demselben Muster. Herkömmliche Vorgehensweisen der Anwendungsentwicklung greifen allerdings nicht. Die bestehenden Methoden sind nicht anwendbar, da KI-Projekte von Daten und nicht von Programmiercode angetrieben werden. Das Lernen wird von Daten abgeleitet.

Der richtige Ansatz und die richtigen Methoden für maschinelles Lernen ergeben sich aus datenzentrierten Anforderungen. Sie führen zu Projekten, die sich in die Phasen der Datenermittlung, der Bereinigung, des Trainings, der Modellerstellung und der Modelliteration einteilen lassen.

Was sind die erwarteten Eingaben in das Modell und die erwarteten Ausgaben?

Legen Sie auch fest, ob das Modell einmalig, in Iterationen mit periodisch eingesetzten Versionen oder in Echtzeit trainiert werden soll. Das Training in Echtzeit stellt viele Anforderungen an die Daten, die bei manchen Konstellationen möglicherweise nicht realisierbar sind.

Darüber hinaus müssen Sie wissen, wie das Modell mit realen Daten arbeiten soll. Soll das Modell beispielsweise offline verwendet werden, und etwa im Batch-Modus mit Daten arbeiten, die asynchron eingespeist und verarbeitet werden? Oder soll es in Echtzeit eingesetzt werden und mit entsprechend hohen Leistungsanforderungen arbeiten, um sofortige Ergebnisse zu liefern? Diese Informationen bestimmen auch die Art der benötigten Daten und die Anforderungen an den Datenzugriff.

Ermitteln Sie also zunächst Ihren Datenbedarf. Prüfen Sie, ob die Daten für das Machine-Learning-Projekt in einem guten Zustand sind. Der Schwerpunkt sollte auf der Identifizierung der Daten liegen, der ersten Sammlung, den Anforderungen, der Qualitätsbestimmung, den Erkenntnissen und potenziell interessanten Aspekten, die eine weitere Untersuchung wert sind. Hier sind einige Schlüsselfragen, die es zu berücksichtigen gilt:

Ein Machine-Learning-Modell wird generiert durch Lernen und durch Verallgemeinerung aus Trainingsdaten. Es wendet dann das erworbene Wissen auf neue Daten an, die es noch nie zuvor gesehen hat, trifft damit Vorhersagen und erfüllt letztendlich seinen Zweck. Fehlende Daten hindern Sie daran, das Modell zu erstellen. Außerdem reicht der bloße Zugriff auf Daten nicht aus. Nützliche Daten müssen auch sauber und in einem guten Zustand sein.

Die Vorbereitung und Bereinigung von Daten kann viel Zeit in Anspruch nehmen. Umfragen unter Entwicklern und Datenwissenschaftlern aus dem Bereich des maschinellen Lernens zeigen, dass die Schritte der Datensammlung und -vorbereitung bis zu 80 Prozent der Zeit eines Machine-Learning-Projekts in Anspruch nehmen können. Dabei sollte man bedenken: Trainieren Sie das Modell mit schlechten Daten, wird das Modell ebenfalls schlecht funktionieren. Da Machine-Learning-Modelle aus Daten lernen müssen, lohnt sich der Zeitaufwand für die Vorbereitung und Bereinigung der Daten.

Bei der Operationalisierung sollten Sie auch verschiedene Überlegungen anstellen: Diese umfassen etwa Modellversionierung und -iteration, Modellbereitstellung, Modellüberwachung und Modellbereitstellung in Entwicklungs- und Produktionsumgebungen. Je nach den praktischen Anforderungen kann die Operationalisierung eines Modells von der einfachen Erstellung eines Berichts bis hin zu einer komplexeren Bereitstellung an mehreren Endpunkten reichen.

Die Operationalisierung des Modells kann verschiedene Bereiche umfassen: Dazu gehören beispielsweise Einsatzszenarien in einer Cloud-Umgebung, an der Edge, in einer lokalen oder geschlossenen Umgebung oder innerhalb einer geschlossenen, kontrollierten Gruppe.

Wenn Sie überzeugt sind, dass Ihr Machine-Learning-Modell in der realen Welt funktioniert, ist es an der Zeit, das zu überprüfen. Dieser Schritt ist auch bekannt als Operationalisierung des Modells:

Schritt 7: Iterieren Sie das Modell und passen Sie es an

Auch wenn das Modell einsatzfähig ist und Sie seine Leistung kontinuierlich überwachen: Sie sind noch nicht fertig. Wenn es um die Implementierung von Technologien geht, heißt es oft, dass die Erfolgsformel darin besteht, klein anzufangen, groß zu denken und häufig zu iterieren.

Abbildung 6: Erfolgreiche KI-Projekte iterieren Modelle immer wieder, um sicherzustellen, dass die Modelle auch in der realen Welt wertvolle, zuverlässige und wünschenswerte Ergebnisse liefern.

Wiederholen Sie den Prozess immer wieder und nehmen Sie rechtzeitig Modifikationen und Verbesserungen für die nächste Iteration vor. Berücksichtigen Sie dabei, dass sich einiges ändert: Geschäftsanforderungen ändern sich. Die technologischen Möglichkeiten ändern sich. Und auch Daten aus der realen Welt ändern sich – oft auf unerwartete Weise.

All dies kann neue Anforderungen für den Einsatz des Modells an anderen Endpunkten oder in neuen Systemen mit sich bringen.

Das Ende kann nur ein neuer Anfang sein, daher ist es am besten, Folgendes festzulegen:

die nächsten Anforderungen an die Funktionalität des Modells

die Ausweitung des Modelltrainings, um das Modell zu verbessern

die Verbesserung der Modell-Performance und -genauigkeit

die Verbesserung der operativen Leistung des Modells

die betrieblichen Anforderungen für verschiedene Einsätze

die Lösungen für einen Modelldrift oder Datendrift, die zu Leistungsänderungen aufgrund von Änderungen der realen Daten führen können.

Denken Sie darüber nach, was in Ihrem Modell funktioniert hat, was überarbeitet werden muss und was noch in Arbeit ist. Ein todsicherer Weg zum Erfolg bei der Entwicklung von Machine-Learning-Modellen ist die kontinuierliche Suche nach Optimierungen – und besseren Möglichkeiten, um den sich ändernden Geschäftsanforderungen gerecht zu werden.