Was ist für den Aufbau eines Datenkatalogs wichtig?

Ein Datenkatalog kann eine Organisation unterstützen, Metadaten zu verwalten und Datenquellen zu erkunden. Tipps zur Erstellung eines Datenkatalogs.

Der Aufbau eines Datenkatalogs ist für viele IT-Teams eine wichtige Initiative, aber Unternehmen sollten ein solches Projekt nicht ohne Input von Geschäftspartnern angehen.

Zunächst ist es wichtig, einen Datenkatalog zu definieren: Es handelt sich um eine Referenzanwendung, die es Geschäfts- und Technologieanwendern ermöglicht, Datenquellen zu erkunden, den Inhalt dieser Quellen (Metadaten) zu verstehen, die Daten mit der Quelle zu verbinden und mit ihrem Daten- und Metadatenzugriff unabhängiger zu werden.

Ein Datenkatalog untersucht Datenbanken und Business-Intelligence-Systeme. Es bietet auch einen einzigen Bezugspunkt für das Metadatenmanagement in Unternehmen und ist schneller sowie effektiver als dies mit früheren Metadatenmanagementsystemen möglich ist.

Die wichtigsten Schritte beim Aufbau eines Datenkatalogs sind unter anderem:

  • Entwurf eines Fachgebietsmodells, das als Grundlage für die Datenarchitektur des Datenkatalogs dient. Ein effektiver Datenkatalog folgt der geschäftlichen Nutzung der Daten und nicht der Implementierung der technischen Anwendungen. Ein Fachgebietsmodell (Subject Area Model, SAM), das jedes Fachgebiet und die darin enthaltenen Konzepte definiert, zeigt Geschäftsanwendern den Standort ihrer Daten, der nicht durch Anwendungen, Dateien oder Datenbanken eingeschränkt ist. Der Datenkatalog sollte auf der Grundlage des Fachgebietsmodells erstellt werden.
  • Data Stewards und IT-Mitarbeitern sollten Metadaten aus allen Datenbanken und Dateien auffinden und abrufen. Datenkataloge verwenden Metadaten, um Datentabellen, Dateien und Datenbanken zu identifizieren. Der Katalog durchsucht die Datenbanken des Unternehmens und lädt die Metadaten (nicht die eigentlichen Daten) in den Datenkatalog. Bevor ein Unternehmen mit dem Aufbau eines Datenkatalogs beginnt, müssen Metadatenquellen identifiziert und aufgezeichnet werden. Dies ist ein wichtiger Schritt und erfordert, dass das Unternehmen über ein solides Data-Stewardship-Programm verfügt, da Data Stewards benötigt werden, um Einblicke in die richtigen Datenquellen zu erhalten.
  • Erstellung eines Metadatenwörterbuchs (kein Geschäftsglossar). Ein Data Dictionary enthält die Beschreibung und Zuordnung jeder Tabelle oder Datei und aller ihrer Metadateneinheiten. Dieses Data Dictionary wird zur Grundlage für den Datenkatalog. Auch hier sind die Business Data Stewards unerlässlich, da sie die im Datenkatalog zu verwendenden Business nach Quelle, Konzept und Fachgebiet bereitstellen.
  • Profile der Daten erstellen, um Statistiken für die Datenkonsumenten bereitzustellen. Diese Profile sind informative Zusammenfassungen, die die Metadaten erklären. Beispielsweise enthält das Profil einer Datenbank oft die Anzahl der Tabellen, Dateien und Zeilenzahlen.
  • Identifizierung von Beziehungen zwischen den Quellen. Ermitteln Sie zusammengehörige Daten über mehrere Datenbanken hinweg. So benötigt beispielsweise ein Analyst konsolidierte Kundeninformationen. Häufig liegen diese Kundendaten aber in verschiedenen Systemen.
  • Die Herkunft der Daten analysieren. ETL-Werkzeugen sollten verwendet werden, um Metadaten aus Quelldatenbanken zu extrahieren, die Metadaten zu transformieren, zu bereinigen und in eine Zieldatenbank zu laden. Auf diese Weise kann der Analytiker Fehler bis zur Grundursache zurückverfolgen.
  • Organisation des Katalogs für den Gebrauch auf Basis des Fachgebietsmodells. Die meisten Dateien und Datenbanken sind für die Nutzung durch entsprechende Technologie konzipiert. Datenkataloge sollten sowohl für Datenkonsumenten als auch für Technologen konzipiert sein. Darüber hinaus sollte ein Datenkatalog über Computer-, Tablet- und mobile Anwendungen zugänglich sein.

Die Erstellung eines Datenkatalogs ist eine Aufgabe, an der Teams aus IT und Business beteiligt sein sollten, um sicherzustellen, dass er sich an den Bedürfnissen der Benutzer orientiert und sie in die Lage versetzt, Metadaten im gesamten Unternehmen zu verwalten. Effektive Planung, Entwicklung und Implementierung von Datenkatalogen kann das Metadatenmanagement in die Geschäftswelt einbringen und einen nachhaltigen Wert für die Datenbestände schaffen.

Folgen Sie SearchEnterpriseSoftware.de auch auf TwitterGoogle+Xing und Facebook!

Nächste Schritte

Fünf Anbieter für das Daten-Management der Zukunft.

E-Guide: Datenanalyse und Daten-Management demokratisieren.

Mit diesen drei Methoden verbessern Sie Ihr strategisches Daten-Management.

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close