denisismagilov - stock.adobe.com

Die Vor- und Nachteile eines hybriden Data Warehouse

Hybride Data Warehouses bieten unter anderem Flexibilität und Skalierbarkeit sowie den Einsatz moderner Analysewerkzeuge. Dadurch wächst jedoch die Komplexität der Architektur.

von

George Lawton

Zuletzt aktualisiert: 12 Jan. 2023

Mit hybriden Cloud-Architekturen erhalten Unternehmen das Beste aus On-Premises- und Cloud-Umgebungen. IT-Administratoren wenden dieses hybride Modell auch auf Data Warehouses an, um diese Vorteile zu nutzen. Doch das Implementieren kann eine Herausforderung sein.

Herkömmliche Data Warehouse sind meist an ein lokales System gebunden. Das schränkt ihre Skalierbarkeit erheblich ein. Mit einem hybriden Data-Warehouse ist es möglich, einige Data-Warehousing-Funktionen in die Cloud zu verlagern, ohne dafür die Funktionen vor Ort großartig zu ändern.

Bevor Sie jedoch ein hybrides Data Warehouse einführen, sollten Sie die Vor- und Nachteile der Technologie sorgfältig abwägen. Außerdem geben wir Ihnen Tipps für das Architekturdesign einer hybriden Umgebung.

Vorteile eines hybriden Data Warehouse

Mit einem hybriden Data Warehouse profitieren Unternehmen von der Flexibilität und der hohen Leistung der Cloud und nutzen gleichzeitig die Vorteile der Datenverfügbarkeit und Sicherheit, die bei der Bereitstellung vor Ort gegeben sind.

Zu den wichtigsten Vorteilen eines hybriden Data-Warehouses gehören im Einzelnen

1. Schneller Einstieg

Ein hybrides Modell erleichtert den Einstieg in die Cloud-Dateninfrastruktur, da das Unternehmen nicht alle seine Daten auf einmal in die Cloud migrieren muss. Stattdessen nutzt es weiterhin die vorhandene Technologie. Ein hybrides Data Warehouse unterstützt Sie außerdem beim Auflösen von Datensilos, die von verschiedenen Abteilungen oder Anwendungen erstellt wurden.

2. Unterstützung von Partnerdaten

Derzeit geht der Trend dahin, interne Datenquellen mit externen Datenquellen von Partnern zu kombinieren, um mehr Kontext für Analysen zu erhalten. Ein hybrides Data Warehouse eignet sich gut für diesen Ansatz und kann das für die Erforschung neuer Analysemodelle erforderliche Data Engineering reduzieren.

3. Datentrennung nach Bedarf

Sowohl On Premises als auch Cloud Data Warehouses haben grundlegende Vorteile. Traditionelle Data Warehouses sind beispielsweise oft kosteneffizienter, während Cloud Data Warehouses eine bessere Skalierbarkeit bieten. Mit einem hybriden Data Warehouse trennen IT-Teams die Datensätze je nach Anwendungsfall, um die Vorteile beider Modelle zu nutzen.

4. Flexibilität

Ein hybrides Data Warehouse macht es einfacher, bei Bedarf andere Datendienste zu nutzen, um neuen Anforderungen gerecht zu werden. Innovative Analysedienste lassen sich problemlos sowohl in der Cloud als auch in lokalen Umgebungen skalieren.

Nachteile eines hybriden Data Warehouse

Im Vergleich zu einem lokalen Data Warehouse kann ein neues hybrides Data Warehouse mehr Aufwand erfordern. Sie benötigen einen detaillierten Plan, um ein Hybrid-Data-Warehouse-Projekt auf den Weg zu bringen. Dieser Plan sollte sich mit verschiedenen Herausforderungen befassen, zum Beispiel mit den folgenden

1. Organisatorische Fragen

Wenn Sie einen neuen Prozess oder eine neue Technologie einführen, sind organisatorische Änderungen erforderlich, und ein hybrides Data Warehouse ist da keine Ausnahme. Manchmal löst dies bei den Mitarbeitern oder Entscheidern interne Widerstände aus, so dass sie das Projekt verzögern oder hintertreiben. Administratoren müssen von Anfang an die Zustimmung ihrer Teams einholen.

2. Kostenüberlegungen

Lokale Systeme wachsen in der Regel nicht unkontrolliert, weil es einen hohen Aufwand erfordert, die Infrastruktur zu erweitern – sowohl technisch als auch finanziell. Im Gegensatz dazu bietet die Cloud unbegrenzte Speicher- und Rechenkapazitäten, so dass die Nutzung von Ressourcen leicht aus dem Ruder läuft. Auch wenn Cloud-Anbieter Tools zur Kostenkontrolle bieten, sollten Sie bei den Cloud-Kosten genauso vorsichtig sein wie bei lokalen Systemen.

3. Unbekannte Tools

Cloud-Data-Warehouses unterscheiden sich oft stark von Ihrer lokalen Infrastruktur und Ihre Mitarbeiter müssen sich in deren Funktionsweise erst einarbeiten. Bevor Sie die neue Lösung ausrollen, sollten Sie die Tool-Optionen sorgfältig prüfen und ein Lernprogramm entwickeln.

Entwerfen Sie ein hybrides Data Warehouse

Im Idealfall kombiniert ein hybrides Data Warehouse die Governance und Effizienz einer lokalen Infrastruktur mit der Skalierbarkeit der Cloud. Ziel ist es, die beiden Infrastrukturen als eine Einheit zu betreiben und nicht als getrennte Datenpools. Es mag zwar einfacher sein, zwei unabhängige Data Warehouses einzurichten und zu betreiben, aber die Pflege und Nutzung zweier getrennter Systeme ist auf Dauer teurer.

Es ist hilfreich, eine hybride Datenarchitektur mit drei grundlegenden Zielen zu entwerfen:

Senken der Datenspeicherkosten und Abbremsen des Datenwachstums ohne Beeinträchtigung der Data Warehouse-Leistung.
Umfassende Datensicherheit und Einhalten gesetzlicher Vorschriften.
Erleichtern des unterbrechungsfreien Datenfluss zwischen den lokalen und den Cloud-Umgebungen, um die Geschäftskontinuität zu gewährleisten.
Einsatz der richtigen Tools

Teams sollten sich nach geeigneten Tools umsehen, um die Optimierung der Datenspeicherung und Datenverarbeitung in lokalen und Cloud-Systemen zu automatisieren. Einen Ansatz bieten Data-Fabric-Tools, die Daten, Analysen und Arbeitsabläufe harmonisieren. Idealerweise schließt dies sowohl die lokale, als auch die Cloud-Infrastruktur mit ein. Zu den Data-Fabric-Tools gehören IBM Cloud Pak for Data, K2View Operational Data Fabric und NetApp Cloud Volumes OnTap.

Außerdem sollten Sie Data-Warehouse-Automatisierungs-Tools in Erwägung ziehen. Diese Tools automatisieren ETL-Vorgänge (Extraktion, Transformation und Laden) zwischen Rohdatenquellen und einem oder mehreren Data Warehouses. Zu den Data Warehouse-Automatisierungs-Tools gehören Azure Data Factory, Informatica Data Validation, Oracle Autonomous Data Warehouse und Qlik Compose for Data Warehouses.

Eine dritte Option sind Data-Warehouse-Tools, die sowohl über lokale als auch über Cloud-Data-Warehouse-Funktionen verfügt, die zusammenarbeiten. Beispiele hierfür sind Cloudera Data Platform, IBM Db2, Oracle Autonomous Data Warehouse und Teradata Vantage.