F

Daten priorisieren und komprimieren ohne Oracle DB 12c Heat Map

Um Daten effizient zu managen, müssen Firmen wichtige von unwichtigen Daten unterscheiden. Das gelingt über das Oracle Automatic Workload Repository.

Zwei entscheidende Frage beim Datenmanagement mit Oracle lauten: Warum ist es wichtig für Unternehmen Daten zu priorisieren? Wie funktioniert das, wenn das Unternehmen noch nicht über die Oracle Database 12c und deren Tool Heat Map verfügt?

Unternehmen erzeugen heute eine Unmenge von Daten, da die meisten Geschäftsprozesse mittlerweile digital ablaufen. Ein weiterer Faktor für die wachsenden Datenmengen sind gesetzliche Vorgaben zur Langzeitarchivierung von geschäftsrelevanten Informationen in digitaler Form. Hinzu kommen Daten, die von Sensoren erfasst wurden, das Internet der Dinge mit einer Vielzahl vernetzter Geräte, die permanent Informationen übertragen, sowie Daten aus sozialen Netzwerken (Facebook, Twitter & Co.).

All diese Daten werden in  riesigen Oracle-Datenbanken abgelegt, allerdings selten gepflegt, überprüft oder gar analysiert. Dahinter steckt folgender Gedanke: „Speicher-Ressourcen sind billig, also speichern wir grundsätzlich alle Daten ab, die wir brauchen“. Diese Einstellung stellt aber mittelfristig ein Problem für Unternehmen dar, da sie nicht alle Daten für immer aufbewahren können. Für eine effiziente Datenhaltung genügt es nicht, die Daten auf einen Speicher zu schaufeln und sich dann nicht mehr darum zu kümmern. Ein weiteres Problem: Legen Unternehmen diese Daten in einer Produktionsdatenbank ab, müssen sie einen beliebigen Teil dieser Daten duplizieren, wenn sie eine Test-Datenbank erstellen wollen. Es ist aber nicht möglich, diese Daten effizient zu sichern (Backup) und zu übertragen.

Information Lifecycle Management mit Oracle

Unternehmen benötigen daher eine Strategie für das Information Lifecycle Management (ILM). Hier geht es zunächst darum, die aktuell wichtigen und relevanten Daten von den derzeit eher unwichtigen Daten zu unterscheiden, die aber aus Compliance-Gründen aufbewahrt werden müssen. Zudem geht es darum, diese Informationen zu trennen. Schließlich müssen Unternehmen im Rahmen von ILM kontinuierlich prüfen, ob die Informationen entsprechend ihrer Relevanz am richtigen Ort liegen. Was häufiger wichtig ist, muss schneller verfügbar sein, wird daher auf teureren Speichermedien abgelegt; was selten benötigt wird, darf länger dauern und kann auf kostengünstigeren Medien gesichert sein. Ziel ist die optimale und kostengünstige Nutzung der Informationen.

Mehr zu Oracle Database 12c

Oracle Database 12c bietet In-Memory-Optionen. Wir erläutern mögliche Lizenz- und Hardwarekosten.

In diesem Artikel bietet unser Experte eine Einführung in die Oracle In-Memory-Option in Database 12.

Um Ihre Datenbank zu konsolidieren, müssen sie im Vorfeld Strategien erarbeiten. Wir geben Tipps hierfür.

In der Oracle Database 12c sind diese ILM-Features vollständig in der Datenbank integriert. Im Wesentlichen handelt es sich dabei um die zwei neuen Funktionen Heat Map und Automatic Data Optimization (Automatische Datenoptimierung). Die Heat Map zeigt Veränderungen und Abfragen auf Zeilen- und Segment-Ebene und bietet damit einen detaillierten Überblick über den Zugriff auf die Daten – und unterscheidet so zwischen aktuell wichtigen und unwichtigen Informationen.

Die Automatische Datenoptimierung verlagert und/oder komprimiert die Daten gemäß Regeln, die der Nutzer definiert hat (Policies). Diese basieren auf den Informationen, die sich aus der Heat Map ergeben. Das heißt Daten, die aus Compliance-Gründen aufbewahrt werden müssen, aber derzeit nicht relevant sind, werden verlagert und komprimiert.

Lösung liegt im Automatic Workload Repository (AWR)

Diese Funktionen stehen aber erst ab der Version 12c zur Verfügung. Da sich die Einführung der neuen Version Oracle DB 12c letztes Jahr verzögert hat, mussten wir bei PayPal eine Zwischenlösung finden, um  unsere Daten effizient zu verwalten. Die Lösung fanden wir im Automatic Workload Repository (AWR). Dort finden sich in den Abschnitten „Segment-Nutzung“ oder „Segment-Statistiken“ alle notwendigen Informationen darüber, welcher Anwender welche Tabelle, welche Partition, welche Indizes zu welchem Zweck benutzt hat. Zudem wird aufgezeigt, ob es dazu Schreib- oder Lese-Vorgänge der Datenbank gegeben hat. 

Diese Informationen aus dem AWR zeigen, welche Daten aktuell für das Unternehmen wichtig und welche Daten eher unwichtig sind. Über eine Partitionierung oder Bereichs-Partitionierung (meist auf Zeit) ist es möglich, diese gerade nicht relevanten Daten von den wichtigen Daten zu trennen, die entsprechende Partition zu komprimieren und die Daten in einen anderen Tabellenraum oder eine andere Datenbank zu verschieben. Nur so gelingt es, die Hauptdatenbank schlank zu halten.

Dies ist absolut notwendig, da das Speichern und lange Aufbewahren von Daten teuer und manchmal zum Problem werden kann. Wir sind aber aus rechtlichen oder Compliance-Gründen gezwungen, diese Daten aufzubewahren.

Über den Autor: John Kanagaraj ist Datenbank-Spezialist bei PayPal.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Erfahren Sie mehr über Datenbanken

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close