Einsatzgebiete für Datenintegrationswerkzeuge

Datenintegration ist nicht ETL: Datenintegrationswerkzeuge entwickeln sich vielmehr zu Plattformen mit verschiedenen Funktionen, die unterschiedliche Anforderungen abdecken.

Datenintegration ist kein Synonym für ETL. Dieser Irrglaube droht  die Funktionsbandbreite einschlägiger Werkzeuge für Datenintegration auf das Einsatzszenario batch-orientierte Datenbewirtschaftung für Business Intelligence zu reduzieren.  Vielmehr entwickeln sich Werkzeuge für die Datenintegration hin zu Plattformen, die über eine Vielzahl an Funktionen den wachsenden unterschiedlichsten Anforderungen im Unternehmen gerecht werden möchten. 

Über den Einsatz als Middleware oder dem nächtlichen Ladeprozess eines Data Warehouses hinaus werden grundlegende Entwicklungen der Werkzeuge in zwei Punkten deutlich. Funktional werden Technologien integriert um Daten neben Batch-Prozessen auch in kürzeren Zyklen analytisch verarbeiten zu können. Prominentes Beispiel hierfür soll eine Callcenter Agent sein, der beim Anruf Kundendaten wie Zahlungsverhalten „near-time“ benötigt um die Rechnungsmodalitäten (Vorkasse, Rechnung, …) richtig platzieren zu können. Über typische latenz-sensitive Szenarien wie Synchronisation oder Replikation hinaus rückt klassische Business Intelligence näher an die operativen Prozesse heran. Gerade hier entstehen neue Aufgabenstellungen, die auch neue Anforderungen an  Datenintegrationswerkzeuge nach sich ziehen. Das Ergebnis findet sich in der Integration von Technologien zur Realisierung  von near-time Szenarien wie Messaging oder Webservices in die bestehenden ETL-Technologien.

Der zweite Punkt betrifft die thematische Erweiterung der Datentransformationsfunktionen, wie auch die Marktentwicklung der letzten Jahre zeigt. Zahlreiche Anbieter für Datenintegration ergänzten ihre Produktpaletten durch Zukäufe von Spezialisten für Datenqualität. Kennzeichnend ist die weitentwickelte Integration der Datenqualitätskomponenten. Das Ergebnis sind oftmals funktional integrierte Datenqualitätskomponenten, die sich aus einer gemeinsam genutzten Entwicklungsoberfläche heraus in einen Datenintegrationsprozess integrieren lassen oder Standardkomponenten zur Integration von Drittanbieter-Komponenten bereitstellen. 

Schwieriger erweist sich die Integrationsthematik hinsichtlich der semantischen Integration,  die ein differenzierendes Merkmal von Datenintegrationslösungen ist. Zu erwarten sind die durchgängige Definition und Dokumentation von Objekten- und Prozessen für die valide Datenbewirtschaftung. Heutzutage gibt es oftmals Medienbrüche zwischen einzelnen Funktionsbausteinen im Datenbewirtschaftungsprozess. 

Ein Beispiel dafür: In einem Projekt werden mittels Data-Profiler Daten analysiert. Auf Basis der Analyse-Ergebnisse werden technische Regeln zur Standardisierung von Daten oder inhaltliche Regeln für Plausibilitätsprüfungen erhoben. Die Überführung der Regeln aus dem Profiling in das Datenbereinigungs-/Datentransformationswerkzeug muss oftmals noch manuell – Eingabe per Hand – geschehen. Die Bereinigungs- und Transformationskomponente hingegen sind heutzutage bereits integriert und können Entwicklungsobjekte gemeinsam nutzen.

Weitere thematische Ergänzungen des Themas Datenintegration bahnen sich derzeit im Bereich Stammdatenmanagement (Master Data Management) sowie im Complex Event Processing (CEP) an.

Zusammenfassend bezeichnet eine funktionale wie auch thematische Erweiterung die Entwicklung und auch Einsatzgebiete von Datenintegrationswerkzeugen als Reaktion auf die wachsenden Anforderungen der Unternehmen insgesamt. Die Antwort der Softwarehersteller findet sich in breit aufgestellten Werkzeugen, die modular (oder lizenzrechtlich) an die Anforderungen angepasst werden können - zum Einen um die eigene Lösung als strategisch gesetzte Plattform positionieren zu können, zum Anderen um über eine Vielzahl an Möglichkeiten weitere Kunden gewinnen zu können.

Über den Autor:

Timm Grosser ist Analyst am Business Application Research Center (BARC) im Bereich Business Intelligence. Seine Spezialgebiete sind entscheidungsunterstützende Informationssysteme mit besonderem Fokus auf die Bereiche Datenqualität, Datenmanagement und Business Activity Monitoring.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Erfahren Sie mehr über Data Governance

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close