denisismagilov - stock.adobe.com

Hybride Data Warehouses: Vor- und Nachteile genau abwägen

Ein hybrides Cloud Data Warehouse bietet unter anderem mehr Flexibilität und Skalierbarkeit sowie On-Demand-Zugang zu den neuesten Analysediensten. Doch es gibt auch Nachteile.

Hybride Cloud-Architekturen locken mit der Idee, die Vorteile einer Cloud- und On-Premises-Infrastruktur zusammenzubringen und die Nachteile auszugleichen. Ob das gelingt, ist jedoch immer eine Frage der konkreten Umsetzung. Das Modell lässt sich auch auf Warehouses anwenden. In diesem Artikel erklären wir, welche Vorteile Sie damit erhalten können – und welche Herausforderungen Sie antizipieren sollten.

Ein traditionelles Data Warehouse ist an ein lokales System gebunden. Das erschwert das Skalieren solcher Infrastrukturen extrem. Mit einem hybriden Data Warehouse können Sie einige Data-Warehousing-Funktionen in die Cloud bringen und gleichzeitig die lokalen Funktionen beibehalten.

Bevor Sie sich entscheiden, sollten Sie aber die Vor- und Nachteile der Technologie sorgfältig abwägen. Außerdem sollten Sie bestimmte architektonische Grundsätze beachten, um den Erfolg Ihres Projekts zu sichern.

Vorteile eines hybriden Data Warehouse

Mit einem hybriden Data Warehouse profitieren Unternehmen von der Flexibilität und hohen Leistung der Cloud und sehen dennoch die Datenverfügbarkeit und Compliance-Vorteile von On-Premises-Bereitstellungen. Zu den wichtigsten Vorteilen eines hybriden Data Warehouse gehören insbesondere die folgenden:

1. Einfacherer Übergang

Ein Hybridmodell erleichtert das Einführen einer Cloud-Dateninfrastruktur. Sie müssen nicht alle Daten auf einmal in die Cloud migrieren, da Sie sich weiterhin auf vorhandene On-Premises-Technologie stützen können. Ein hybrides Data Warehouse kann das Auflösen von Datensilos erleichtern, die von verschiedenen Abteilungen oder Anwendungen erstellt wurden.

2. Anbinden der Datenspeicher von Geschäftspartnern

Derzeit ist es ein großer Trend, interne Datenquellen mit externen Datenquellen von Partnern für verbesserte Analysen zu kombinieren. Ein hybrides Data Warehouse eignet sich gut für diesen Ansatz und kann den technischen Aufwand reduzieren, der zum Erkunden neuer Analysemodelle erforderlich ist.

3. Datentrennung nach Bedarf

Nicht alle Data Warehouses haben dieselben Ansprüche. So haben Sie vielleicht Datenpools, bei denen es Ihnen vor allem wichtig ist, sie günstig aufzubewahren, während Sie bei anderen eine flexible Größe und schnelle Analyse benötigen. Mit einem hybriden Data Warehouse können Sie Datensätze hinsichtlich ihres jeweiligen Anwendungsszenarios trennen, um die Vorteile jedes Modells zu nutzen.

4. Flexibilität und Zugang zu modernen Analysemethoden

Ein hybrides Data Warehouse macht es einfacher, bei Bedarf neue Datendienste zu erschließen, um den sich ändernden Anforderungen gerecht zu werden. Aufkommende Analysedienste können problemlos sowohl in der Cloud als auch in lokalen Umgebungen skaliert werden.

Im Vergleich zu einem lokalen Data Warehouse erfordert die Implementierung eines hybriden Data Warehouse oft mehr Aufwand.

Nachteile eines hybriden Data Warehouse

Im Vergleich zu einem lokalen Data Warehouse erfordert die Implementierung eines hybriden Data Warehouse oft mehr Aufwand. Sie benötigen einen genauen Plan und geschultes Personal, um ein Hybrid-Data-Warehouse-Projekt auf den Weg zu bringen. Dieser Plan sollte verschiedene Herausforderungen benennen, darunter:

1. Organisatorische Fragen

Um einen neuen Prozess oder eine neue Praxis zu implementieren, sind organisatorische Änderungen erforderlich, und ein hybrides Data Warehouse ist da keine Ausnahme. Der interne Widerstand gegen Veränderungen kann heftig sein, mit der Folge, dass Projekte verschoben werden und das Unternehmen Geld und Ressourcen verschwendet. Administratoren müssen von Anfang an von ihren Teams unterstützt werden.

2. Kosten

On-Premises-Systeme verlangen beim Einstieg hohe Investitionen – sowohl technisch als auch finanziell – um die Infrastruktur anzuschaffen und zu erweitern. Unternehmen haben diese Ausgaben in der Regel gut im Blick. Im Gegensatz dazu bietet die Cloud endlose Speicher- und Rechenfunktionen, sodass Ressourcen leicht außer Kontrolle geraten. Cloud-Anbieter stellen zwar Tools zur Verfügung, um die Preistransparenz zu verbessern. Doch es bleibt Aufgabe der Kunden, diese auch sorgfältig anzuwenden.

3. Mangelnde Kenntnisse im Unternehmen

Das Einführen von Cloud Data Warehouses verlangt allen Verantwortlichen ab, dass sie den Umgang mit der neuen Plattform erlernen und neue Workflows entwickeln. Das kann auch ein Hybrides Szenario nicht ändern. Unternehmen sollten daher vorab darüber nachdenken, wie sie ihre Mitarbeiter für die neuen Systeme schulen.

Entwerfen Sie ein hybrides Data Warehouse

Idealerweise kombiniert ein hybrides Data Warehouse die Governance und Effizienz einer lokalen Infrastruktur mit der Skalierbarkeit der Cloud. Ziel ist es, die beiden Infrastrukturen nicht als getrennte Datenpools, sondern als Einheit zu betreiben. Während es einfacher sein mag, zwei unabhängige Data Warehouses zu betreiben, wird es auf Dauer viel teurer, als ein gut verknüpftes hybrides Data Warehouse

Es ist hilfreich, eine hybride Datenarchitektur mit drei zugrunde liegenden Zielen zu entwerfen:

  • Reduzieren der Kosten für Datenspeicher und das Verwalten des Datenwachstums ohne Leistungseinbußen
  • Umfassende Datensicherheit und Einhalten gesetzlicher Standards.
  • Unterbrechungsfreier Datenfluss zwischen den On-Premises und Cloud-Umgebungen, um die Geschäftskontinuität zu gewährleisten.

Finden Sie das richtige Tool

Teams müssen nach geeigneten Werkzeugen suchen, um die Optimierung der Datenspeicher und Datenverarbeitung in lokalen und Cloud-Systemen zu automatisieren. Ein Ansatz sind Data Fabric Tools, die Daten, Analysen und Workflows harmonisieren.

Diese Ansätze sollten lokale und Cloud-native Data Warehouses umfassen. Zu den beliebten Data Fabric Tools gehören IBM Cloud Pak for Data, K2View Operational Data Fabric und NetApp Cloud Volumes OnTap. Daneben kann ein Data-Warehouse-Automatisierungs-Tools helfen. Diese Tools automatisieren ETL-Vorgänge (Extrahieren, Transformieren, Laden) zwischen Rohdatenquellen und einem oder mehreren Data Warehouses.

Zu dieser Art Software zählen Azure Data Factory, Informatica Data Validation, Oracle Autonomous Data Warehouse und Qlik Compose for Data Warehouses. Schließlich kommen auch Data Warehouse Tools mit lokalen und Cloud-Data-Warehouse-Funktionen in Frage, die zusammenarbeiten können. Beispiele sind Cloudera Data Platform, IBM Db2, Oracle Autonomous Data Warehouse und Teradata Vantage.

Erfahren Sie mehr über Datenbanken

ComputerWeekly.de
Close