sdecoret - stock.adobe.com

Datensilos mit strenger Data Governance auflösen

Datensilos können für Datenspezialisten ein großes Problem sein. Eine strenge Data Governance Policy kann verteilte Daten verhindern und zu einer besseren Datenqualität führen.

Eine der Hauptursachen für Probleme bei der Datenqualität sind isolierte Daten. In Silos isolierte Daten führen oft zu doppelten Daten und in vielen Fällen zu unterschiedlichen Auffassungen von wichtigen Geschäftsprozessen. Aus diesem Grund ist es wichtig, den Abbau von Datensilos zu einem zentralen Bestandteil jeder Initiative für eine bessere Datenqualität zu machen.

Was ist ein Datensilo?

Ein Datensilo ist eine Sammlung von Informationen in einem Unternehmen, die nicht effektiv unter den Geschäftseinheiten geteilt werden. Obwohl die Business Unit, die das Silosystem besitzt, und vielleicht noch einige weitere Einheiten wissen, dass die Daten vorhanden sind, sind sich andere Teile der Organisation nicht über ihre Existenz oder ihre Nutzung durch Anwender im Klaren.

Einige der häufigsten Ursachen für Datensilos sind:

  • Fehlende organisatorische Kontrolle. Die Organisation verwaltet Daten nicht effektiv als wichtige Unternehmensressource. Beispielsweise gibt es keine Einheit, die die Daten und ihre Verwendung auf Unternehmensebene regelt.
  • Geschäftswachstum. In Wachstumsphasen entstehen oft neue operative Einheiten, damit sich andere Einheiten besser auf die Schlüsselaspekte ihres Geschäfts konzentrieren können. Diese Einheiten erstellen oder erwerben Datenelemente, die ihren eigenen, einzigartigen Geschäftsanforderungen entsprechen. In dem Maße, wie die Anzahl der Einheiten wächst, wachsen auch die Datensilos.
  • Kulturelle Fragen. Geschäftseinheiten betrachten Daten, die sie kontrollieren, oft als einen Vermögenswert, der ihre Bedeutung für das Unternehmen erhöht und die sie deshalb ungern teilen. Doch es gibt auch weniger dysfunktionale Gründe für eine Geschäftseinheit, Daten in einem Silo zu halten. Ein solcher Grund ist etwa die Meinung, dass die gemeinsame Nutzung der Informationen zu einem Kontrollverlust über die Datenqualität führt. Oder dass unerwünschte Änderungen an ihren Systemen vorgenommen werden müssen, wenn Datendefinitionen an die Unternehmensanforderungen angepasst werden.
  • Technische Gründe. Die zunehmende Beliebtheit von Drittanbieter- und insbesondere von SaaS-Anwendungen beschleunigt das Wachstum der Datensilos. Das liegt daran, dass viele dieser Anwendungen Informationen in Cloud-Datensilos speichern, die von den Anbietern bereitgestellt werden.

Warum sind Datensilos schlecht?

Wenn Sie schon längere Zeit in der IT-Branche tätig sind, werden Sie wahrscheinlich die Probleme, die Datensilos verursachen, gut verstehen. Die wichtigsten sind:

  • Es gibt keine einheitliche Datenquelle, auf die Sie sich für eine qualitativ hochwertige Entscheidungsfindung verlassen können;
  • Daten in Systemen von Geschäftseinheiten können doppelt und mehrfach vorkommen;
  • Es sind doppelte Anstrengungen zur Erstellung und Verwaltung der gleichen Informationen nötig;
  • Eine 360-Grad-Sicht auf einen Kunden, Partner oder ein Produkt zu erstellen, ist praktisch unmöglich;
  • Verantwortliche können kaum mehr unternehmensweite Geschäftstrends erkennen;
  • Unterschiedliche Definitionen für die gleichen Datenelemente in getrennten Systemen führen zu Inkonsistenzen und schlechter Datenqualität.

Data Governance und Abbau von Datensilos

Um die Anzahl der Datensilos und ihre negativen Auswirkungen zu reduzieren, müssen Sie sowohl Präventions- als auch Korrekturstrategien entwickeln. Hier sind einige Schritte, die Sie dazu unternehmen sollten.

Zunächst sollten Sie eine Kultur aufbauen, in der alle Unternehmensdaten als wertvolle Unternehmensressource betrachtet werden. Fördern Sie die Vorteile einer guten Datenqualität, der gemeinsamen Nutzung von Daten und thematisieren Sie Daten als die Single Source of Truth für IT- und Geschäftseinheiten.

Als Nächstes sollten Sie die Verantwortung für die unternehmensweite Data Governance einer Person oder – bei größeren Unternehmen – einem Team zuweisen. Übertragen Sie diesen Akteuren die Verantwortung und Autorität für die Verwaltung aller Datenbestände und das Management der Datenqualität. Dazu gehören auch die Konsolidierung von Datensilos und die Erstellung von Verfahren für den Datenaustausch. Ihre Rolle sollte darin bestehen, Entwicklern dabei zu helfen, festzustellen, ob die von ihnen benötigten Informationen bereits vorhanden sind, und festzulegen, wo neue Datenelemente gespeichert werden.

Sobald Sie ein Datensilo identifiziert haben, treffen Sie sich mit dem Eigentümer des Silos. Evaluieren Sie zusammen mit ihm die Nutzung der Daten und bestimmen Sie, ob das Silo konsolidiert, ersetzt oder als ein Aufzeichnungssystem für die Organisation behandelt werden soll.

Wenn Sie noch kein Silosystem besitzen, evaluieren Sie eine Data-Warehouse-Umgebung. Eine solche Umgebung unterstützt Sie bei der Konsolidierung von Daten aus mehreren operativen Quellen. Mit Unterstützung von Data Warehouses können Sie die Informationen, die Sie aus den operativen Systemen duplizieren, exakt steuern und gemeinsam nutzen.

Evaluieren Sie außerdem Software zur Stammdatenverwaltung und Tools zur Sicherung der Datenqualität. Damit erleichtern Sie die effektive Datenverwaltung und etablieren eine Single Source of Truth. Die Angebote reichen von Open-Source-Software wie Talend bis hin zu kommerziellen Plattformen von IBM, Informatica, Information Builders, Oracle, SAP, SAS und anderen Anbietern.

Aufbau einer Data-Governance-Richtlinie

Eine Data-Governance-Richtlinie beschreibt die Rollen, Regeln, Prozesse und Best Practices, die eine Organisation befolgen sollte, um die Qualität und ordnungsgemäße Nutzung ihrer Daten sicherzustellen. Eine solche Richtlinie kann auch bei der Auflösung von Datensilos helfen. Eine vorgeschlagene Gliederung enthält eine Absichtserklärung, in der der Auftrag und die Ziele der Data-Governance-Richtlinie definiert werden und die durch die Unterschriften von Sponsoren der Geschäftsleitung unterstützt werden. Darüber hinaus sollte eine Richtlinie die folgenden Aspekte eines Data-Governance-Programms abdecken:

Struktur. Eine Organisationsstruktur ist erforderlich. Dazu gehören die Sponsoren aus dem oberen Management, ein Lenkungsausschuss, der Datenstandards und -regeln festlegt, Teammitglieder, die für die Datenqualität auf Unternehmensebene verantwortlich sind, und Data Stewards, die beim Management von Abteilungsinformationen helfen. Jede Rolle sollte ihre Governance-Verantwortlichkeiten, Aktivitäten und Befugnisse umfassen.

Abbildung 1: Gründe für ein Data-Governance-Programm.
Abbildung 1: Gründe für ein Data-Governance-Programm.

Erstellung von Daten. Es sollte Richtlinien geben, die den Besitz, die Speicherung und die Definition neuer Datenelemente kontrollieren. Diese Richtlinien sollten auch Klassifikationen der Sicherheit und der gesetzlichen Rahmenbedingungen umfassen, sowie Zugriffsmethoden und Maßnahmen zur Datenprüfung, -speicherung, -sicherung und -archivierung.

Datenzugriff. Verfahren für Datenanfragen sollten Überprüfungen der Sicherheit umfassen sowie die Einhaltung von Vorschriften, Lesen versus Aktualisierung, Datenzugriffsverfahren und -Tools sowie Leistungskennzahlen.

Datennutzung. Schreiben Sie einen ethischen Verhaltenskodex für Daten. Dieser sollte Einschränkungen hinsichtlich Missbrauch, unbefugten Änderungen, absichtlicher Fälschung und absichtlicher Zerstörung enthalten.

Datenintegrität. Installieren Sie Verfahren, die die Qualität und Herkunft vorhandener Daten schützen, einschließlich Richtlinien zur Änderung von Datendefinitionen und zur Aktualisierung von Datenelementen.

Datenkorrektur. Definieren Sie Verfahren, in denen die Schritte zur Identifizierung, Korrektur und Bestimmung der Grundursache von schlechter Datenqualität beschrieben werden.

Gemeinsame Nutzung von Daten. Zu den Best Practices für die gemeinsame Nutzung von Daten im Unternehmen gehören Kontrollen für abteilungsübergreifende Datenänderungen, Bestimmungen zur Identifizierung und Konsolidierung von Datensilos und Richtlinien für die Erstellung und Verwendung gemeinsam genutzter Datenspeicher.

Erfahren Sie mehr über Datenverwaltung

ComputerWeekly.de
Close