jamesteohart - stock.adobe.com

Zukunft der Datenwissenschaft: Karriere- und Branchentrends

Da neue Technologien die Aufgaben von Datenwissenschaftlern verändern, ist das künftige Jobprofil von Data Sciencists unklar. Der Beruf befindet sich im Wandel.

Data Scientists oder Datenwissenschaftler gehören heute zur begehrtesten Berufsgruppe in vielen Unternehmen. Der Grund: Organisationen, die über gute Datenwissenschaftler verfügen, können aus ihren Daten Mehrwert und damit wirtschaftliche Vorteile generieren.

Data Scientist ist kein Job mit einem festgelegten Profil. Die Aufgaben von Data Scientists entwickeln sich im Zuge technologischer Innovationen und deren Marktreife stetig weiter. Historisch gesehen waren die Titel Statistiker, Aktuar und Quant, je nach Branche, Vorläufer des Titels Datenwissenschaftler.

Macht man sich Gedanken, wie sich die Rolle des Datenwissenschaftlers verändert, stellen sich einige Herausforderungen. Ein zentrales Problem ist, dass es trotz der hohen Nachfrage nach Datenwissenschaftlern keine klaren Anforderungen gibt.

Was ist Datenwissenschaft?

Data Science umfasst die Untersuchung und Nutzung von Daten, um Geschäftsentscheidungen zu treffen und neue kundenorientierte Produkte zu entwickeln. In der Regel sind Datenwissenschaftler für die Datenanalyse zuständig. Ihr Ziel ist es, auf Basis der Daten und Analysen neue Erkenntnisse zu gewinnen. Data Scientists arbeiten häufig mit ausgefeilten Machine-Learning-Modellen und können auf der Datengrundlage vergangener Trends künftiges Kunden- oder Marktverhalten vorhersagen.

Der Mehrwert, den sich Unternehmen von Datenwissenschaftlern erhoffen, wird sich auch in Zukunft nicht ändern. Aber die Art und Weise, wie Datenwissenschaftler diesen Wert erreichen, wird sich in den kommenden Jahren verändern.

Hat Data Science eine Zukunft?

80 Prozent der Arbeit eines Datenwissenschaftlers besteht darin, Daten für die Analyse vorzubereiten. Inzwischen verkaufen Technologieanbieter aber bereits Plattformen, die solche Aufgaben automatisieren. Sie abstrahieren Daten in Low-Code- oder No-Code-Umgebungen, wodurch ein Großteil der Arbeit, die derzeit von Datenwissenschaftlern erledigt wird, wegfällt.

„Der Job des Datenwissenschaftlers wird wahrscheinlich in den Hintergrund treten, weil sich immer mehr Tools durchsetzen", sagt Kathleen Featheringham, Direktorin für KI-Strategie und -Schulung bei Booz Allen Hamilton, einer Management- und IT-Technologieberatungsfirma. „Für mich ist das mit dem Webdesign vor einigen Jahren vergleichbar. Damals brauchte man Leute, die gut programmieren konnten – doch jetzt kann man online gehen und ein Tool benutzen, das die Website für einen erstellt."

Werden KI und Automatisierung Datenwissenschaftler ersetzen?

Um die Zukunft der künstlichen Intelligenz (KI) vorhersagen zu können, muss man ihre Vergangenheit verstehen. Die ältesten Bereiche der Datenwissenschaft – Analytik und Stochastik – integrierten die Wahrscheinlichkeitstheorie und -analyse in die Programmierung. Die Sprache R entstand als Open-Source-Äquivalent zu SASS und SRS – zwei alte Analysepakete, die ihre Wurzeln in Fortran hatten. Die Integration ähnlicher Pakete in Python machte diese Sprache zur ersten Wahl, wenn es darum ging, die Ergebnisse einer Datenanalyse mit anderen Komponenten zu kombinieren.

Abbildung 1: Vergleich zwischen Data Scientists und Data Engineers.
Abbildung 1: Vergleich zwischen Data Scientists und Data Engineers.

Diese Entwicklung machte den Weg frei für visuelle Tools wie Alteryx oder Microsoft Power BI. Diese Werkzeuge erforderten zwar weniger Programmierkenntnisse. Sie setzten aber dennoch ein ausreichendes Verständnis der Statistik voraus, um zu wissen, was diese Pakete tun. Dass der Bedarf an Kompetenz bei der Modellierung solcher Pipelines jemals ganz verschwinden wird, ist unwahrscheinlich. Damit kann der Status und die Notwendigkeit eines engagierten Datenwissenschaftlers verblassen, aber der Bedarf an fachlich kompetenten Analysten bleibt weiter bestehen.

Daneben kann man argumentieren, dass sich das Gebiet des maschinellen Lernens, das ein Verständnis für höhere Mathematik erfordert, bereits außerhalb des Bereichs der Datenwissenschaftler bewegt. Dies fällt in die Zuständigkeit der Kognitionswissenschaft, wo neuronale Netze Aufgaben wie Spracherzeugung, Bilderkennung, kontextbezogene Klassifizierung und ähnliche Themen übernehmen.

Kognitive Graphen schließlich, die mathematische Graphen zur Unterstützung der Inferenzanalyse verwenden, lagen eine Zeit lang außerhalb des Bereichs der formalen Datenwissenschaft. Sie nehmen jetzt allerdings wieder zunehmend die Rolle des Machine Learning Engineer ein. Es hat sich nämlich in der Praxis herausgestellt, dass reine Lösungen für maschinelles Lernen in der Regel für den Aufbau von Inferenzsystemen unzureichend sind. Ein Bereich, der heute besonders faszinierend ist, sind sogenannte Graph Neutral Networks. Gleichzeitig bedeutet das Aufkommen von Bayesschen Netzen und Markov-Ketten innerhalb von Graphensystemen eine völlig neue Art des Managements von Predictive Analytics.

Die Konsequenz: Wie für Berufe im Technologiebereich typisch, verschwindet der Datenwissenschaftler als eigenständiger Job. Doch neue Berufe, die den Fortschritt der Programmierung in diesen Bereichen integrieren, sind so wichtig wie eh und je.

Wie wird sich Quanteninformatik auf die Datenwissenschaft auswirken?

Quantencomputing und Quanteninformatik stecken zwar noch in den Kinderschuhen – sie sind aber ein neuer Markt für Datenwissenschaftler.

„Wenn man eine Berechnung auf einem klassischen Computer durchführt und eine Reihe von Eingaben hat, muss man sie nacheinander ausführen. Auf einem Quantencomputer kann man sie gleichzeitig durchlaufen lassen“, sagt Patty Lee, Chief Scientist bei Honeywell Quantum Solutions.

Allerdings benötigt man dafür nicht nur neue Hardware, sondern auch andere Software: „Man kann nicht einfach einen klassischen Rechenalgorithmus nehmen und ihn an einen Quantencomputer anschließen. Sie müssen neue Algorithmen entwickeln, die sich die quantenmechanischen Eigenschaften zunutze machen. Dann kann man die Informationen auf neue Weise aus den Daten extrahieren“, erläutert sie.

Quantendatenwissenschaftler müssen die Quantenmechanik verstehen: Sie müssen wissen, wie man einen Quantenalgorithmus zur Lösung eines bestimmten Problems einsetzt. Lee ist jedoch überzeugt, dass man dafür nicht unbedingt einen Hochschulabschluss benötigt. „Wir brauchen eine Menge Leute in diesem Bereich, denn es gibt Experten auf der Anwenderseite von Unternehmen und Quantentheoretiker, die sich mit Quantenalgorithmen auskennen. Wir brauchen Fachleute in der Mitte, die die Übersetzung vornehmen“, so Lee.

Jobs für Datenwissenschaftler und Dateningenieure

In der heutigen Welt ist ein Unternehmen besser dran, wenn es die richtige Mischung aus datenaffinen Fähigkeiten hat als die richtige Mischung aus Berufsbezeichnungen.

Dennoch helfen Berufsbezeichnungen Personen und Gruppen, den Umfang ihrer Verantwortlichkeiten und ihre Gehaltsskala zu verstehen. Selbst Personen, die den begehrten Titel Data Scientist erlangt haben, können in eine andere Rolle hineinwachsen, weil sie besser zu ihnen passt oder ihr Unternehmen etwas anderes braucht.

„Data Scientists haben die Erwartung, dass sie nur mit maschinellem Lernen arbeiten, was nicht der Fall ist. Sie müssen sich auch fragen, wie sie die Daten vorbereiten und wie sie die Daten in die Pipeline bringen“, sagt Weston. „Die Herausforderung liegt darin, dass sich das Datenvolumen und die Datenvielfalt ändern – und deshalb ist die Fähigkeit, Daten zu verarbeiten und zu verschieben, ein technisches Problem.“

Viele Unternehmen glauben, dass sie einen Datenwissenschaftler brauchen, aber das ist nicht unbedingt der Fall. Der Personaldienstleister ManpowerGroup ist sich dieses Phänomens bewusst. Der Projektverantwortliche fragt seine Kunden daher zunächst, welches Geschäftsproblem sie lösen möchten.

„Viele Leute hören Schlagworte und wollen diese realisieren, aber es ist nicht wirklich das, was sie brauchen“, sagt Chuck Kincaid, leitender Data Scientist und Produktarchitekt bei Experis Solutions, einer Tochtergesellschaft der ManpowerGroup.

Kincaid sagt, seine größte Sorge seien Bewerber, die in ihrem Lebenslauf Software auflisten, die sie nicht richtig zu nutzen wissen. Ebenso warnt er vor Bewerbern, die versuchen, ein Projekt in Eigenregie zu stimmen, das tatsächlich aber in einer Gruppe umgesetzt werden sollte.

Grundlegende Qualifikationen für Datenwissenschaftler

Die Data Science Association, ein gemeinnütziger Berufsverband von Datenwissenschaftlern, möchte Standards für die Zertifizierung und Lizenzierung von Datenwissenschaftlern festlegen. Aus beruflicher Sicht würde dies bedeuten, dass Datenwissenschaftler vordefinierte Kriterien erfüllen müssen, um den Titel führen zu dürfen. Im Umkehrschluss bedeutet das, dass jeder, der keine Lizenz besitzt, den Titel nicht legal verwenden darf.

Weston legt großen Wert darauf, die Qualifikationen der Bewerber zu überprüfen – und ist oft enttäuscht. Wenn er einem Kandidaten beispielsweise ein hypothetisches Szenario vorlegt, sagen 49 von 50 Kandidaten, dass sie noch nie in der Branche gearbeitet haben, in der das hypothetische Szenario spielt. Dabei sollten sie einfach ihre Problemlösungskompetenz unter Beweis stellen und eine Antwort finden – unabhänigig von der Branche.

„Kürzlich hatte ich ein Vorstellungsgespräch mit einem Bewerber, der einen umfangreichen Lebenslauf hatte. In diesem waren Data Science, Big Data und viele Qualifikationen in den Bereichen aufgeführt, die wir suchen. Beispielsweise brauchen wir hochentwickelte Analytics-Fähigkeiten im Umgang mit Big Data, da wir es mit Daten im Petabyte-Bereich zu tun haben“, sagt Weston. „Ich sagte: ‚Wir verwenden Python für den größten Teil unseres Codes. Wie können wir Python in Amazon EMR Spark verwenden? Er konnte diese Frage nicht beantworten und hatte noch nie etwas von PySpark gehört. Eine berechtigte Frage, denn in seinem Lebenslauf standen drei Jahre Erfahrung in genau diesem Bereich.“

Abschlüsse und Zertifizierungen in Datenwissenschaft

Viele der besten Datenwissenschaftler haben einen Hochschulabschluss in Mathematik oder Statistik und sind Meister im Lösen von Problemen. Andere kommen aus der Informatik, Astrophysik oder anderen Fächern.

„Glaube ich, dass Datenwissenschaftler diese speziellen Abschlüsse haben müssen? Nein, ganz und gar nicht“, sagt Featheringham. „Es gibt viele Vorstellungen, welche Qualifikationen ein Data Scientist haben sollte. Aber für mich ist wichtig, dass es jemand ist, der von Natur aus neugierig ist.“

Wie jede andere Rolle kann sich auch der Datenwissenschaftler zu etwas anderem entwickeln - und es gibt einige Anzeichen dafür, dass dies geschehen wird.

Letztendlich verändert sich die Rolle des Datenwissenschaftlers, auch wenn das genaue Ausmaß der Veränderung umstritten ist. Automatisierte Lösungen beschleunigen und vereinfachen einige Aufgaben, aber sie machen Datenwissenschaftler noch nicht arbeitslos. In der Zwischenzeit entstehen neue Möglichkeiten. Ein Beispiel ist Quantencomputing.

Wird der Beruf des Datenwissenschaftlers irgendwann verschwinden? Einige glauben, dass dies der Fall sein wird. In der Zwischenzeit gibt es jedoch viele Möglichkeiten für diejenigen, die ihr Handwerk beherrschen.

Erfahren Sie mehr über Datenanalyse

ComputerWeekly.de
Close