Definition

Predictive Analytics

Predictive Analytics (prädiktive Analyse) ist eine fortgeschrittene Analysemethode, die sowohl neue als auch historische Daten zur Vorhersage von Aktivitäten, Verhalten und Trends verwendet. Sie umfasst die Anwendung statistischer Analysetechniken, analytischer Abfragen und automatisierter Algorithmen für Machine Learning auf Datensätze, um Vorhersagemodelle zu erstellen, die einen numerischen Wert für die Wahrscheinlichkeit des Eintretens eines bestimmten Ereignisses berechnen.

Software für Predictive Analytics verwendet Variablen, die gemessen und analysiert werden können, um das wahrscheinliche Verhalten von Personen, Maschinen oder anderen Einheiten vorherzusagen. Zum Beispiel berücksichtigt eine Versicherungsgesellschaft bei der Preisgestaltung und der Ausstellung von Autoversicherungspolicen potenzielle Fahrsicherheitsvariablen wie Alter, Geschlecht, Standort, Fahrzeugtyp und Fahrtenregister.

Mehrere Variablen werden zu einem Vorhersagemodell kombiniert, das in der Lage ist, zukünftige Wahrscheinlichkeiten mit einem akzeptablen Zuverlässigkeitsgrad zu bewerten. Die Software stützt sich auf fortschrittliche Algorithmen und Methoden, wie zum Beispiel logistische Regression, Zeitreihenanalysen und Entscheidungsbäume.

Predictive Analytics hat mit dem Aufkommen von Big-Data-Systemen an Bedeutung gewonnen. Da Unternehmen größere und breitere Datenpools in Hadoop-Clustern und anderen Big-Data-Plattformen ansammeln, haben sie vermehrt Data-Mining-Möglichkeiten geschaffen, um prädiktive Erkenntnisse zu gewinnen. Die verstärkte Entwicklung und Kommerzialisierung von Machine-Learning-Anwendungen durch IT-Anbieter hat dazu beigetragen, die Möglichkeiten von Predictive Analytics zu erweitern.

Predictive-Analytics-Methoden
Abbildung 1: Predictive Analytics stützt sich auf drei Methoden.

Marketing-, Finanz- und Versicherungsunternehmen verwenden in hohem Maße Predictive-Analytics-Software, ebenso wie Anbieter von Suchmaschinen und Online-Diensten. Predictive Analytics wird auch häufig in Branchen wie dem Gesundheitswesen, dem Einzelhandel und der Fertigung eingesetzt.

Zu den Geschäftsanwendungen für Predictive Analytics gehören die gezielte Ausrichtung von Online-Werbung, die Analyse des Kundenverhaltens zur Bestimmung des Kaufverhaltens, die Kennzeichnung potenziell betrügerischer Finanztransaktionen, die Identifizierung von Patienten, bei denen das Risiko besteht, dass sie bestimmte Krankheiten entwickeln, und die Erkennung bevorstehender Teileausfälle in Industrieanlagen, bevor sie auftreten.

Verfahren und Techniken von Predictive Analytics

Predictive Analytics erfordert ein hohes Maß an Fachwissen über statistische Methoden und die Fähigkeit, prädiktive Datenmodelle zu erstellen. Folglich ist sie typischerweise die Domäne von Data Scientists, Statistikern und anderen qualifizierten Analytikern. Diese werden von Dateningenieuren unterstützt, die bei der Erfassung relevanter Daten und deren Aufbereitung für die Analyse helfen, sowie von Softwareentwicklern und Geschäftsanalysten, die bei der Datenvisualisierung, den Dashboards und Berichten helfen.

Data Scientists verwenden Vorhersagemodelle, um nach Korrelationen zwischen verschiedenen Datenelementen in Website-Clickstreams, Gesundheitsdaten von Patienten und anderen Arten von Datensätzen zu suchen. Sobald die Datenerfassung erfolgt, wird ein statistisches Modell formuliert, trainiert und bei Bedarf modifiziert, um genaue Ergebnisse zu erzielen. Das Modell wird dann mit den ausgewählten Daten abgeglichen, um Vorhersagen zu erstellen. In einigen Anwendungen werden vollständige Datensätze analysiert, in anderen jedoch verwenden die Analyseteams Stichproben, um den Prozess zu rationalisieren. Die Datenmodellierung wird validiert oder überarbeitet, sobald zusätzliche Informationen verfügbar sind.

Datenmanagementprozess
Abbildung 2: Der Predictive-Analytics-Prozess beginnt mit dem Verständnis des Unternehmens und der Aufbereitung der Daten. Anschließend wird ein statistisches Modell erstellt, ausgewertet und eingesetzt, um die Daten zu verarbeiten und Vorhersagen abzuleiten.

Der Predictive-Analytics-Prozess ist nicht immer linear, und Korrelationen stellen sich oft dort ein, wo Data Scientists nicht hinschauen. Aus diesem Grund besetzen einige Unternehmen die Positionen von Data Scientists mit Mitarbeitern aus der Physik und anderen wissenschaftlichen Disziplinen. Selbst wenn Unternehmen den eher konventionellen Weg gehen und Mathematiker, Statistiker und Informatiker als Data Scientists einstellen, ist die Aufgeschlossenheit gegenüber der Datenexploration ein Schlüsselattribut für eine effektive prädiktive Analyse.

Sobald die prädiktive Modellierung (Predictive Modeling) zu verwertbaren Ergebnissen führt, kann das Analyseteam diese mit den Führungskräften des Unternehmens teilen, in der Regel mit Hilfe von Dashboards und Berichten, die die Informationen präsentieren und auf der Grundlage der Ergebnisse zukünftige Geschäftsmöglichkeiten aufzeigen.

Funktionale Modelle können auch in betriebliche Anwendungen und Datenprodukte eingebaut werden, um Echtzeit-Analysefunktionen bereitzustellen, wie zum Beispiel eine Empfehlungsmaschine (Recommendation Engine) auf einer Website eines Online-Händlers, die Kunden auf der Grundlage ihrer Surfaktivitäten und Kaufentscheidungen auf bestimmte Produkte hinweist.

Über die Datenmodellierung hinaus können andere Techniken, die von Data Scientists und Experten, die sich mit Predictive Analytics beschäftigen, eingesetzt werden:

  • Textanalysesoftware zur Analyse von textbasierten Inhalten, wie zum Beispiel Word-Dokumente, E-Mails und Social Media Posts;
  • Klassifikationsmodelle, die Daten in vordefinierte Kategorien organisieren, um das Auffinden und Abrufen zu erleichtern; und
  • Neuronale Netzwerke, die menschliches Lernen nachahmen und Predictive Analytics automatisieren.

Predictive-Analytics-Anwendungen

Online-Marketing ist ein Bereich, in dem Predictive Analytics einen erheblichen Einfluss auf das Geschäft hat. Einzelhändler, Anbieter von Marketing-Dienstleistungen und andere Organisationen verwenden Predictive Analytics Tools, um Trends in der Browsing-Historie eines Website-Besuchers zu identifizieren und die Werbung zu personalisieren. Einzelhändler verwenden Kundenanalysen, um zu entscheiden, welche Arten von Produkten der Einzelhändler auf Lager halten sollte.

Predictive Maintenance entwickelt sich auch zu einer wertvollen Anwendung für Hersteller, die ein Gerät auf Anzeichen für einen möglichen Ausfall überwachen. Im Zuge der Entwicklung des Internets der Dinge (Internet of Things, IoT) integrieren Hersteller Sensoren in Maschinen und mechatronischen Produkten. Die Daten der Sensoren werden dazu verwendet, um zu prognostizieren, wann Wartungs- und Reparaturarbeiten durchgeführt werden sollten, um Probleme zu vermeiden.

Das Internet der Dinge ermöglicht vorausschauende Analysen zum Beispiel zur Überwachung von Öl- und Gaspipelines, Bohrinseln, Windmühlenparks und verschiedenen anderen industriellen IoT-Installationen. Lokalisierte Wettervorhersagen für Landwirte, die zum Teil auf Daten basieren, welche von mit Sensoren ausgestatteten Wetterdatenstationen auf den Feldern der Landwirtschaftsbetriebe gesammelt werden, sind eine weitere IoT-gesteuerte Anwendung für Predictive Modeling.

Analytics Tools

Es gibt eine breite Palette von Tools für Predictive Modeling und Analytics. IBM, Microsoft, das SAS Institute und viele andere Softwareanbieter bieten Tools für Predictive Analytics und verwandte Technologien zur Unterstützung von Machine-Learning- und Deep-Learning-Anwendungen an.

Darüber hinaus spielen Open-Source-Anwendungen eine große Rolle auf dem Markt für Predictive Analytics. Die Open-Source-Analysesprache R wird häufig in Predictive-Analytics-Anwendungen verwendet, ebenso wie die Programmiersprachen Python und Scala. Mehrere Open Source Predictive-Analytics- und Machine-Learning-Plattformen sind ebenfalls verfügbar, einschließlich einer Bibliothek von Algorithmen, die in die Spark Processing Engine integriert ist.

Analytics-Teams können die Open-Source-Basisversionen von R und anderen Analysesprachen verwenden oder für die kommerziellen Versionen bezahlen, die von Anbietern wie Microsoft zur Verfügung gestellt werden. Die kommerziellen Tools können teuer sein, aber sie werden mit technischer Unterstützung durch den Anbieter geliefert, während Benutzer von reinen Open-Source-Versionen die Fehlerbehebung selbst übernehmen oder Hilfe über die Support-Websites der Open Source Community suchen müssen.

Diese Definition wurde zuletzt im Februar 2020 aktualisiert

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close