Strukturierte Daten auslagern – weshalb und wohin mit den Daten?

Es ist nicht lange her, dass ein Data Warehouse als Datenspeicher angesehen wurde. Mittlerweile sollte man strukturierte Daten aber ausgelagern.

Es ist noch nicht allzu lange her, dass ein Data Warehouse (DWH) als so etwas wie ein allgemeiner Datenspeicher angesehen wurde. Es wurde dabei kein Unterschied gemacht, ob es sich um operative oder dispositive Daten handelte. Nachdem sich eine weitgehend allgemein gültige Sicht auf die Struktur und den Zweck eines DWH herausgebildet hat, nämlich im DWH Daten zur Unternehmenssteuerung abzulegen, macht sich in der Praxis die Frage bemerkbar, wie man den Lebenszyklus der im DWH aufbewahrten Daten und deren Zusammenhang mit den operativen Daten zu sehen hat. Und zum Lebenszyklus von Daten gehört auch die Auslagerung aus den Ursprungssystemen, was man auch mit Archivierung bezeichnen kann. Wir bevorzugen hier jedoch eher die Begriffe inaktiv bzw. historisch, da Archivierung eher die Sicht ungenutzt assoziiert, was bei einem DWH falsch ist.

Wir von BARC treffen in diesem Zusammenhang immer mehr auf folgende Fragestellungen:

  • Wie geht man mit dem Thema Auslagerung von strukturierten Daten im Umfeld Business Intelligence um?
  • Was unterscheidet Daten, die aktiv, inaktiv oder historisch sind, voneinander?
  • Welche Schlüsselfragen hat man sich zu stellen, wenn man die Auslagerung strukturierter Daten ins Auge fasst?
  • Wie gehe ich dabei mit dem Thema um, das man etwa unter dem Begriff Domänen von Geschäftsobjekten zusammenfasst?

Lassen Sie uns zunächst einige Begriffe klären:

  • Aktiv sind Daten in den operativen Systemen, wenn sie einem Änderungsprozess unterliegen. Inaktiv dann, wenn sie keinen Änderungen mehr unterliegen. Historisch, wenn sie für das operative Geschäft kaum mehr genutzt werden.
  • Im DWH sind die Begriffe inaktiv und historisch kaum zu unterscheiden. Die Zeitachse, damit die Historie ist ja gerade eine wichtige Sicht auf die Daten.

Daraus ergibt sich die Frage: kann man eigentlich DWH-Daten auslagern? 

Allgemeiner: kann man strukturierte Daten so auslagern, dass deren Struktur im Zugriff erhalten bleibt?

Ja, dies ist möglich. Die Systeme, die man dazu benutzt, unterscheiden sich von Archivierungssystemen für Dateien (= unstrukturierte Daten) in dem Punkt, dass mit den Daten aus der Datenbank auch die Metadaten (=die Struktur der Modelle) mit ausgelagert werden. Für den Zugriff wird dann dieselbe Abfragesprache als Schnittstelle (Beispiel: SQL,…) zur Verfügung gestellt, wie wenn die Daten in den ursprünglichen Datenbanken abgespeichert wären. Was sich gegenüber den Originaldatenbanken ändert, sind u.a. folgende Parameter:

  • Kosten
  • Zugriffsgeschwindigkeit

Verwendet wird diese Auslagerungsmethode derzeit vor allem bei der Auflösung von Altapplikationen, deren Datenbestand inaktiv, aber strukturell unverändert weiter zur Verfügung stehen soll.

Wenn Sie dem Thema Auslagerung strukturierter Daten näher treten, sollten Sie sich folgende Fragen stellen:

  • Sind in Ihrem Unternehmen auch 80% der strukturierten Daten inaktiv ?
  • Gehört Ihr Datenzentrum zu den 50%, die auch auf Grund von unkontrollierbarem Datenwachstum bei den Kosten explodieren?
  • Gehören Sie zu den 70% Unternehmen, wo diese wachsenden Kosten die zweitwichtigste Position im  IT Budget darstellen?
  • Müssen Sie auch mehr mit weniger tun? Auslagerung von strukturierten Daten ist  kein Ideal mehr, sondern ein unmittelbares Muss.
  • Wie beeinflusst der Zwang, strukturierte Daten aufzubewahren und das damit verbundene Applikations- und Datenwachstum die Performanz der Applikationen und die Speicherkosten?
  • Worin unterscheidet sich die Auslagerung von strukturierten Daten von der Auslagerung von unstrukturierten  und semistrukturierten Daten?

Die wichtigste Frage dabei  ist: Was wären Ihre Gründe dafür, strukturierte Daten  auszulagern? 
Ein Beispiel dazu, das aus dem DWH-Umfeld stammt:

  • Ein DWH weist üblicherweise eine geschichtete Granularität auf. Das bedeutet, dass verschiedene Verdichtungsstufen in einem DWH abgespeichert werden, die in sogenannten Drill-Down-Verfahren  bis zu den detaillierten operativen Daten zugänglich gemacht werden.
  • Eine Möglichkeit, selektiv die Auslagerung von strukturierten Daten zu betreiben, wäre somit, die feingranularen Daten, die eher seltener gebraucht werden, auszulagern.

Die zweitwichtigste Frage ist: welche Daten lagere ich aus? 

Da es sich um strukturierte Daten handelt, sind die Daten in Geschäftsobjekte und deren Beziehungen zusammengefasst. Ausgelagert werden können daher nur logisch zusammengehörige Bereiche (= Domänen) von Geschäftsobjekten. Sie haben hier eine ähnliche Frage zu lösen, wie wenn Sie sich entscheiden, was in ihr ERP-System und was in ihr CRM-System kommt. Im DWH-Umfeld ist es jedoch einfacher: die Daten sind eingefroren, es sollte damit kein Abgleich zwischen den Daten im DWH-Originalspeicher und im Auslagerungsspeicher notwendig sein.

Was bleibt, ist die Frage der Kosten. Dazu werden von den Anbietern im Vorfeld Berechnungsmodelle zur Verfügung gestellt. 

Ich denke, Sie sollten sich dem Thema Auslagerung von Daten frühzeitig zuwenden. Auch DWH’s wachsen, und das ziemlich rasch.

Über den Autor:

Siegmund Priglinger ist Analyst und Berater bei BARC und Repräsentant von BARC in Österreich. Sein fachlicher Schwerpunkt ist Data Governance und Master Data Management als Teil von IT Governance. Priglinger hat mehr als 25 Jahre Erfahrung als Produkt- und Lösungsanbieter, IT-Manager und Unternehmensberater für ICT. Er unterstützt sowohl Softwarehersteller bei deren „Business Development“ als auch Softwarenutzer im Einsatz und der Evaluierung von Software aus Sicht „Software enables the Business“.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Erfahren Sie mehr über Business Intelligence

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close