ra2 studio - stock.adobe.com

Data Science Storytelling ist kritische Analytics-Fähigkeit

Data Science Storytelling entwickelt sich zu einer entscheidenden Fähigkeit bei der Datenanalyse. Ohne Storytelling neigen Datenanalysen zu verzerrten Ergebnissen.

Es ist nicht lange her, da wurden Data Scientists vor allem für ihre Fähigkeit bewertet, Informationen entdecken, verstehen, kuratieren und synthetisieren zu können. Gleichzeitig wurden Programmierkenntnisse immer wichtiger, da Datenumgebungen immer größer und mit mehr Rechenleistung ausgestattet wurden. Im Laufe der Zeit entstanden detaillierte Anforderungen, darunter KI-Expertise und das Erkennen korrekter Daten.

In jüngster Zeit, da viele Unternehmen die Rendite aus Investitionen in fortschrittliche Datenanalysefunktionen realisieren, fehlt ihnen allerdings oft die Fähigkeit, zwischen dem, was die Daten ausdrücken, und dem, was das Unternehmen benötigt, zu übersetzen. Diese Fähigkeit, Daten einen Sinn zu geben und diesen Sinn so zu vermitteln, dass Mitarbeiter, die nicht eng mit Daten arbeiten, sie aber benötigen, wird als Data Science Storytelling bezeichnet.

Datenanalyse und organisatorische Fehler

Betrachten wir eine typische Situation in Unternehmen: die Verantwortlichen möchten Argumente für eine Investition sammeln. Unabhängig vom formalen Prozess, der erforderlich ist, gibt es zu Beginn meist ein Gespräch – auch Pitch genannt –, in dem eine oder mehrere beteiligte Parteien versuchen, den Wert der Investition zu ermitteln, um Mittel und Ressourcen zu binden. Oftmals geht diesem Pitch voraus, dass jemand mit Zugriff zu den entscheidenden Daten und den nötigen Analysefähigkeiten gebeten wird, Argumente hierfür zu formulieren.

Bewaffnet mit dieser Fähigkeit, können Data Scientists Modelle konstruieren, um den Pitch zu unterstützen. Sie können auf Tools zurückgreifen, um Visualisierungen zu erstellen, die zum Ergebnis beitragen. Das Team schließt die Analyse ab und liefert die Ergebnisse auf Wunsch an die Beteiligten weiter. All diese Arbeiten werden für den Pitch gemacht.

Doch dieses einfache Szenario beinhaltet mehrere Probleme im Bereich Data Storytelling. Am Anfang steht das, was man als a priori Schlussfolgerung bezeichnet, also die Annahme einer Schlussfolgerung, die von der Analyse unterstützt werden soll. Das heißt: Die Data Scientists werden gebeten, zu einem vorher festgelegten Ergebnis zu kommen. Die Analyse erfolgt unabhängig von der Formulierung aller möglichen Chancen. Anschließend werden diejenigen einbezogen, die nach unterstützenden Argumenten gesucht haben.

Informationsverlust in dieser kritischen Phase und die verpasste Gelegenheit, eine sinnvolle Frage zu stellen, kann oft dazu führen, dass man einen Pitch sowie ein Projekt mit einer Art kognitiver Verzerrung beginnt – eine Verzerrung, die sich aus der Art und Weise ergibt, wie man ein Problem oder eine Chance versteht.

Ausgerüstet mit der Erkenntnis, zu der das Team gelangt ist, wurden die vorhandenen Daten analysiert. Dabei wurde allerdings nicht diskutiert, ob die vorliegenden Daten ausreichend oder repräsentativ waren. Die Verwendung von Daten, nur weil sie sofort verfügbar sind, wird manchmal als Convenience Sampling bezeichnet und kann häufig zu falschen oder unvollständigen Schlussfolgerungen führen.

Schließlich verwendet das Data-Science-Team Visualisierungen – erstellt mit den verfügbaren Tools –, um die Analysen denjenigen zu präsentieren, die den Pitch gestartet haben. An dieser Stelle fehlt allerdings ein tiefes Verständnis der Analyse.

Selbst wenn es eine Debatte über Fragen und Bedenken mit den Beteiligten gab, fehlen diese wahrscheinlich in der Abschlusspräsentation. Vereinfachung ist der Schlüssel zu einer effizienten Entscheidungsfindung, aber eine zu starke Vereinfachung kann zu einer falsch informierten Entscheidung führen.

Aus diesem Grund ist es wichtig, drei Best Practices für das Data Science Storytelling im Auge zu behalten:

  1. Einbeziehung aller Beteiligter in die Erstellung der Analyse: Dies hilft, den Informationsverlust zu minimieren, stellt ein klares Verständnis für die Schlussfolgerungen sicher und mildert den Verlust potenziell kritischer Details in der endgültigen Entscheidung.
  2. Alle Daten und Analysemethode sorgfältig berücksichtigen: Dies unterstützt die empirische Genauigkeit, zum Beispiel, ob das Ergebnis replizierbar ist, und schützt vor Verzerrungen.
  3. Eine Vereinfachung anstreben, die zur richtigen Entscheidung führt: Eine übermäßige Vereinfachung bis hin zum Weglassen von Details, die die Entscheidung verändern können, kann ein entscheidendes Manko sein. Visualisierungen sollten verwendet werden, um eine Geschichte zu erzählen, aber nicht, um die kritischen Punkte im Argument zu verdecken – zum Beispiel, welche Annahmen getroffen wurden und warum die Daten die richtigen Daten sind, um zu einer Schlussfolgerung zu kommen.

Tod durch Daten

Wenn wir überlegen, welche Fähigkeiten für künftige Unternehmensentscheidungen relevant sind, sollten wir wichtige Trends wie Data Federation berücksichtigen.

Da Daten und Analysen immer häufiger verfügbar sind, werden natürlich immer mehr Mitarbeiter gebeten, Data-Science-Kenntnisse für ihre Arbeit zu nutzen. Genau wie damals, als Präsentationssoftware verfügbar war, und Fachleute ohne Grafikkenntnisse plötzlich Schriftarten, grafische Darstellungen und andere Fähigkeiten haben mussten, sind auch heute viele Mitarbeiter möglicherweise nicht bereit für diesen Schritt. Das analytische Äquivalent von „Tod durch Präsentationen/PowerPoint“ kann zu „Tod durch Daten“ werden.

Während die Föderation von Daten und Analysen im Unternehmen weitergeht, sollten Führungskräfte sorgfältig überlegen, welche Schritte sie unternehmen, um sicherzustellen, dass die Mitarbeiter über die richtigen Fähigkeiten verfügen. Dazu gehören unter anderem Fähigkeiten zur Problemformulierung sowie ein grundlegendes Verständnis und das Wissen um Verzerrungen. Die Mitarbeiter sollten wiederum durch dedizierte analytische Ressourcen unterstützt werden.

Starke Entscheidungen treffen

Ein weiterer kritischer Trend geht mit einer Lösung voran. Mit zunehmender Verbreitung von künstlicher Intelligenz (KI) und anderen Methoden, führen wir häufig Gespräche über Tools oder Methoden, um eine Lösung zu finden. Es ist durchaus üblich, dass Gespräche mit „Wie können wir KI verwenden, um Kundenbewertungen zu verstehen?“ beginnen. Oder: „Wie können wir visualisieren, wie unser neues Produkt besser funktioniert?“

Wir müssen aber vorsichtig sein, wenn wir lediglich mit einem Werkzeug oder einer Technik etwas erreichen möchten. Die Wissenschaft lehrt uns, dass wir mit Fragen mehr erreichen. Überlegen Sie, wie sich der Ansatz ändern kann, wenn wir fragen: „Haben wir Zugang zu Daten über Y, die ausreichen, um zu verstehen, was los ist?“ Oder: „Mit welcher Methode können wir diese Daten analysieren?“ Oder: „Wie genau müssen wir sein, um eine Entscheidung treffen zu können?“

Diese Art von Fragen führen immer noch zu Daten und Analysen, aber sie führen viel eher zu effektiven Entscheidungen. Und sie führen zu der Fähigkeit, eine Geschichte mit einem Ende zu erzählen, das zu einer starken Entscheidung führt.

Nächste Schritte

Wie unterscheiden sich Data Scientists von anderen Analytics-Berufen?

Data-Science-Projektbeispiel für Deep-Learning-Profis.

Analytics mit der RapidMiner Data Science Platform.

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close