Fotolia

Oracle-Werkzeuge für die Echtzeit-Datenintegration

Oracle GoldenGate 11g bietet eine Vielzahl von Funktionen im Bereich Real-Time Data Warehousing und führt dadurch zu deutlichen Prozessoptimierung.

Oracle bietet eine Reihe von Werkzeugen, mit denen sich die Integration von Echtzeit-Daten in Data Warehouses von Unternehmen realisieren oder erweitern lässt. Richtig eingesetzt, kann mit ihnen eine Plattform entstehen, die Echtzeit-Bewegungen von Daten über mehrere Systeme hinweg unterstützt und zugleich dabei hilft, Schutz und Sicherheit der Daten zu gewährleisten.

Eines der wichtigsten Tools dafür ist Oracle GoldenGate 11g for Real-Time Data Warehousing. Oracle selbst beschreibt es als Echtzeit-Produkt zur Datenakquisition, das mit Funktionen für Log-basiertes Change Data Capture (CDC) in Echtzeit eine kontinuierliche Erfassung und Ablieferung der zuletzt veränderten Daten zwischen OLTP-Systemen und dem Data Warehouse bietet. Diese Definition ist etwas lang und ungelenk, doch sie lässt recht gut den Hauptzweck von GoldenGate erkennen.

Kurz gesagt, bietet GoldenGate die Erfassung von Transaktionsdaten sowie Routing, Transformation und Auslieferung in Echtzeit über einen Push-Ansatz. Dabei wird erkannt, wenn eine neue Datenbank-Transaktion im Quellsystem festgeschrieben wird. Diese Daten werden dann über die Transaktionslogs der Datenbank sofort erfasst und in das Data Warehouse geschickt, wo sie für erweiterte strategische und operative Business Intelligence (BI) verwendet werden können.

Oracle GoldenGate selbst führt am Punkt der Erfassung oder bei der Auslieferung einfache, zeilenbasierte Transformationen durch – ein idealer Ausgangspunkt für Echtzeit-Datenintegration. Trotzdem hat das Werkzeug seine Schwächen, und für Umgebungen mit erheblichem Transformationsbedarf dürften zusätzliche Integrationswerkzeuge erforderlich sein.

Zum Beispiel bietet sich hier eine Integration mit Oracle Data Integrator Enterprise Edition (EE) 11g an. In dieser Konfiguration liefert GoldenGate 11g zur Unterstützung einer Architektur für Extract, Transform and Load (ETL) Transaktionsdaten für In-Database-Transformationen mit Data Integrator EE an einen Staging-Bereich im Data Warehouse.

Ebenso kann Oracle GoldenGate Daten an einen bestehenden ETL-Server liefern. Kurz gesagt macht GoldenGate einen Verzicht auf Batch-Zeitfenster möglich und wirkt sich wenig störend aus. Es unterstützt die Bewegung von großen Datenvolumen, erleichtert die Wiederherstellung von Daten bei Ausfällen und bewegt lese-konsistente Daten mit referentieller Integrität.

Eine der wichtigsten Stärken von GoldenGate liegt in der ihm eigenen Heterogenität: Es unterstützt Log-basiertes CDC für eine breite Palette an Datenbanken – Oracle Database, SQL Server, IBM DB2 OS/390 und LUW, Sybase ASE, Enscribe, SQL/MP und SQL/MX sowie Teradata auf Linux, Unix, Microsoft Windows, Oracle Solaris und NonStop-Plattformen von Hewlett-Packard. Diese Plattform-übergreifende Kompatibilität macht GoldenGate zu einem idealen Kandidaten für größere Unternehmen, die durch Fusionen und Übernahmen entstanden sind. Denn damit können bestehende Systeme bei Projekten für Echtzeit-Datentransformation weitergenutzt werden.

Die Heterogenität zeigt sich auch an der Fähigkeit von GoldenGate, Informationen an unterschiedlichste Data Warehouses zu liefern: SQL Server, Teradata, Oracle Database, Netezza, Greenplum, HP Neoview und jedes andere Warehouse auf einer Datenbank, die der Schnittstelle Open Database Connectivity entspricht. Zudem ist GoldenGate für die Erfassung von und Auslieferung an Oracle Exadata Storage Server zertifiziert. Für den Austausch mit Messaging-Systemen lässt es sich mit Oracle GoldenGate Application Adapters verwenden.

Weitere Produkte im Oracle-Angebot sind Oracle Data Quality for Data Integrator 11g und Oracle Data Profiling 11g. Beide haben einen bestimmten Wert für das schwierige Gesamtbild von Echtzeit-Datenintegration. Data Quality bringt Erweiterungen für den Transformationsprozess mit – es gibt Organisationen die Möglichkeit, die Qualität von Daten aus jedem Bereich zu messen, zu verbessern und zu verwalten.

Im Idealfall lässt es sich dafür einsetzen, Kunden- und Produktdaten zu inspizieren und Risiko-Positionen zu minimieren. Dadurch wird verhindert, dass „schlechte Daten“ in den Transformationsprozess geraten, so dass der Wert der übrigen steigt. Weitere Funktionen sind Datenprofilierung, Datenreinigung sowie Matching und Monitoring. Der Schwerpunkt dabei liegt darauf, Organisationen beim Umgang mit Echtzeit-Daten zu unterstützen – also sicherzustellen, dass Daten valide sind und Normen entsprechen.

Oracle Data Profiling 11g ist ein Werkzeug für Untersuchungen und Qualitätsmonitoring, mit dem Unternehmensnutzer die Qualität ihrer Daten mittels Kennzahlen bewerten können. Außerdem können sie auf der Grundlage dieser Daten Regeln ableiten und die Entwicklung der Datenqualität im Zeitverlauf im Auge behalten. Bei der Anwendung auf Echtzeit-Datentransformation wird Data Profiling 11g zudem immer genauer: Bevor sie in einem BI-Prozess verwendet werden, werden Daten auf der Grundlage von früheren Erfahrungen gesäubert.

Eines ist sicher: In Data Warehouses Echtzeit-Datenintegration zu realisieren, ist heute kein Ding der Unmöglichkeit mehr. Oracle und seine Konkurrenten bieten eine riesige Sammlung von Werkzeugen zur Erleichterung des Übergangs zu Echtzeit-BI und -Analytik mit so aktuellen Daten wie möglich – und zwar ganz ohne umständliche Batch-Verarbeitung. Oracle hat eine komplette Suite von Produkten für diese Aufgaben im Angebot. Mit diesen Zusatz-Technologien lassen sich Echtzeit-Datensammlung und -Transformation in Phasen erledigen, was Prozesse über heterogene Data Warehouses hinweg reibungsloser macht. Insbesondere bei Warehouse-Konsolidierungen in Zusammenhang mit Fusionen, Übernahmen und Restrukturierungen sollte man über ihren Einsatz intensiv nachdenken.

Erfahren Sie mehr über Data Governance

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close