BI-Architekturen für analytische Anforderungen von morgen erweitern

Claudia Imhoff und Colin White stellen eine Business-Intelligence(BI) -Umgebung vor, die bestehende Data Warehouses mit neuen Technologien verbindet.

Es sind spannende Zeiten für die Implementierer von Business Intelligence (BI) und Data Warehouses: Jede Menge neue und bahnbrechende Technologie stehen zur Wahl. Allerdings bringen technischen Neuerungen immer auch den Bruch mit bestehenden Architekturen, Techniken und Traditionen mit sich. Dagegen sind auch Data Warehouses und Business Intelligence nicht gefeit. 

Aus dem derzeitigen Hype erwächst eine neue Generation von Data Warehouses und BI-Architektur. Dazu gehören:

  • Fortgeschrittene Analysefähigkeiten, wie etwa statistische und prädiktive Analysen, Echtzeit-Analysen und hochentwickelte Visualisierung von Daten.
  • Verbessertes Management von neuen und bislang unüblichen Datenquellen (im Sinne von Big Data) mit neuen Konzepten wie Daten-Raffinerien (Data Refineries) und durch die Nutzung von Daten-Virtualisierung oder Data Blending Tools, um klassische ETL-Ansätze (Extract, Treansform, Load) in Richtung Datenintegration zu optimieren.
  • Neue Einsatzmöglichkeiten, etwa in der Cloud, auf mobilen Endgeräten sowie mit Appliances, die Hard- und Software anwendungsspezifisch vereinen.

Der Bedarf an neuen Technologien wird gesteigert durch den wachsenden Druck auf die Unternehmen, schneller geschäftsrelevante Informationen zu erhalten und gleichzeitig die Kosten für die wachsenden Systemumgebungen zu senken.

Kein Wunder also, dass viele Anwender sich fragen, wie und wo diese neuen Einsatzmöglichkeiten mit ihren bestehenden BI- und Data-Warehouse-Umgebungen kombinierbar sind. Spielt das Enterprise Data Warehouse (EDW) noch eine Rolle? Wie passt Hadoop da hinein? Wie können sie den steigenden Unternehmensbedarf an Echtzeit-Analytic decken? Um diese Fragen zu beantworten, stellen wir hier die eXtended Data-Warehouse-Architektur (XDW) vor.

Data Warehouse bleibt unverzichtbar

Enterprise Data Warehouse
Abbildung1: Das traditionelle Enterprise Data Warehouse

Beginnen wir gleich mit der ersten Frage: Hat das EDW in der neuen BI-Architektur noch einen Platz? Die Antwort ist ein kräftiges Ja – zumindest auf absehbare Zeit. Seine Rolle ändert sich etwas, denn es wird zur Quelle etablierter und standardisierter Reports, Vergleiche und Analysen. Doch das Data Warehouse bleibt weiterhin die beste Quelle integrierter, qualitativ hochwertiger Daten für kritische und sensible BI-Analysen, um finanzielle, regulatorische oder Compliance-Vorgaben einzuhalten. Das gilt auch für Standard-Komponenten von BI-Dashboards, wie Leistungskennzahlen und andere Geschäftsmetriken, die in den operativen Abläufen, Marketing, Sales und weiteren Abteilungen genutzt werden. Nichts liefert diese wichtigen Daten zuverlässiger als das EDW.

XDW-Komponenten
Abbildung 2: Neue XDW-Komponenten

Dennoch leistet die traditionelle Data-Warehouse-Architektur, wie sie in Abbildung 1 veranschaulicht wird, nicht alles, was Unternehmen heute an analytischen Möglichkeiten benötigen. Das XDW berücksichtigt die Tatsache, dass dem klassischen EDW Grenzen gesetzt sind – vor allem, wenn es um neue Arten von Daten, experimentelle und investigative Analysen sowie um Echtzeitanalysen geht.

Wenden wir uns also der zweiten Frage zu: Wo kommen Hadoop und andere neue Technologien ins Spiel? Die Innovationen in relationalen und nicht-relationalen Datenmanagement-Plattformen machen es erforderlich, das klassische EDW zu verlassen und neue Komponenten zur BI-Architektur hinzuzufügen.

Mit neuen Tools lassen sich Daten erforschen

Abbildung 2 zeigt drei wesentliche Komponenten, die wir ausgemacht haben, um das bestehende EDW so zu erweitern, dass es ganz neuartige Erkenntnisse durch BI ermöglicht. Zunächst ist da die investigative Computing-Plattform. Hier werden die Innovationen in relationaler Software und Hadoop-Technologie sichtbar. Die Plattform dient dazu, Daten zu erforschen und neue Analysen und analytische Modelle zu entwickeln, zu deren Anwendungsmöglichkeiten beispielsweis Data Mining zählt. Andere Anwendungen sind Ursache-Wirkungs-Analysen, What-if-Analysen, Mustererkennung und allgemeine ungeplante Untersuchungen von Daten.

Manche Organisationen werden die investigative Computing-Plattforrm vielleicht nur zum Experimentieren in einer Sandbox nutzen. Andere können eine komplette Analyseplattform damit aufbauen oder sie als Erweiterung der Daten-Raffinerie einsetzen (siehe unten). 

Diese neuen Komponenten eröffnen Firmen die Möglichkeit, große Mengen von Daten schnell und ungehindert mit bisher nicht gekannter Effizienz zu analysieren oder experimentell zu nutzen. Die Ergebnisse diese Maßnahmen lassen sich dann im EDW, einer Echtzeit-Analytics-Engine im operativen Umfeld oder in einzelnen Geschäftsanwendungen nutzen.

Rohdaten brauchen Veredelung

Die zweite Komponente ist die Daten-Raffinerie. Sie nimmt große Mengen von unbearbeiteten Detaildaten aus unterschiedlichsten Quellen, wie zum Beispiel Sensoren, Social Mediam, RFID-Tags und anderen in Echtzeit arbeitenden Tools auf und lädt sie in eine relationale oder nicht relationale Datenbank. Ähnlich wie eine Ölraffinerie Rohöl in Erdölerzeugnisse umwandelt, destilliert die Data Refinery aus Rohdaten nutzbare Informationen, die sie dann an die investigative Computing-Plattform oder das EDW weiterleitet. Dieses Verfahren erfordert häufig flexiblere Data Governance Policies für Datensicherheit, Datenschutz, Datenqualität sowie die Archivierung und Vernichtung von Daten, als sie in der Datenintegrationsplattform einer herkömmlichen EDW-Architektur zu finden sind.

eXtended Data-Warehouse-Architektur
Abbildung 3:Die komplette eXtended Data-Warehouse-Architektur (XDW)

Die letzte Erweiterung beantwortet die Frage, wie Firmen die Möglichkeit von Echtzeit-Analysen bereitstellen. Diese Komponente besteht aus einer Echtzeit-Analyse-Plattform, die in das operative Umfeld integriert ist. Sie unterstützt die Entwicklung und Einführung von analytischen Echtzeitanwendungen für Web-Event-Analysen, Traffic-Flow-Optimierung und Risiko-Analysen. Da die analytischen Modelle und Regeln, die der Echtzeit-Analyse-Plattform zugrunde liegen, in der Regel im EDW, der investigativen Computing-Plattform und in der Echtzeit-Analyse Plattform selbst entwickelt werden, sind eine enge Verbindung und ungehinderter Datenfluss zwischen diesen drei Komponenten notwendig.

Abbildung 3 zeigt das Zusammenspiel in der neuen XDW-Architektur. Bestehendes und neues Daten-Management, BI und Analyse-Technologie bestehen nebeneinander und ergänzen sich mit ihrer jeweiligen Funktionalität. Jede Komponente in dieser erweiterten BI-Architektur ist dafür optimiert, ihre spezifischen Leistungen zu erbringen. Für die Zukunft dürfte diese übergreifende Architektur sich kaum verändern. Die Anforderungen für produktiv einsetzbare, investigative und echtzeitfähige Analysefähigkeiten dürften relativ konstant bleiben. Die eingesetzten Technologien, um diese Fähigkeiten nutzbar zu machen, werden sich hingegen in dem Maße verändern, wie neue Funktionen und Verbesserungen der technischen Grundlagen verfügbar werden.

Über die Autoren:

Als Vordenkerin, Visionärin und Praktikerin ist Claudia Imhoff, Ph.D., eine international anerkannte Expertin für Analytics, Business Intelligence und die Architekturen zur Unterstützung dieser Disziplinen. Darüber hinaus ist sie Gründerin des Boulder BI Brain Trust, eines Zusammenschlusses von unabhängigen Analysten und Beratern.

Colin White ist Gründer von BI Research und Präsident von DataBase Associates. Er ist bekannt für sein Wissen über Data Management, Information Integration und Business-Intelligence-Technologien sowie ihre Anwendung, um Unternehmen agil zu machen.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Erfahren Sie mehr über Business Intelligence

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close