Dieser Artikel ist Teil unseres Guides: SAP HANA: Die In-Memory-Lösung von SAP verstehen und nutzen

Business Warehouse (BW) und HANA: Sechs Tipps für das Daten-Management mit SAP

SAP Business Warehouse (BW), SAP HANA oder beides: Wir geben sechs Tipps, wie Unternehmen das Daten-Management mit SAP HANA und BW optimieren können.

Die Anforderungen an effizientes Daten-Management mit SAP-Anwendungen sind hoch. Unternehmen tappen häufig im Dunklen, welche Lösung sich am besten eignet: SAP NetWeaver Business Warehouse (SAP NetWeaver BW), eine Plattform für Data Warehousing inklusive Tools zur Extraktion, Modellierung und Aufbereitung von Daten, die In-Memory-Datenbank SAP HANA oder die Kombination beider Anwendungen?

SAP selbst beschäftigt sich schwerpunktmäßig mit der Zusammenarbeit von SAP Business Warehouse (BW) und der In-Memory-Plattform, da eine bestehende BW-Umgebung in den meisten Fällen nicht durch SAP HANA ersetzt, sondern ergänzt wird. Wichtige Fragen bleiben jedoch Fragen unbeantwortet: Zum Beispiel welche Technologien für die verschiedenen Daten-Managementszenarien jeweils am besten geeignet sind oder wie SAP BW und HANA beim Daten-Management interagieren.

Herausforderungen beim Daten-Management bewältigen

Um Antworten auf diese Fragen zu bekommen, muss im ersten Schritt die aktuelle Positionierung von SAP HANA und BW im Hinblick auf die Aufgaben beim Daten-Management hinterfragt werden. Es gilt herauszufinden, in welchen Bereichen SAP HANA und BW konkurrieren oder sich sinnvoll ergänzen. Im Folgenden werden daher Funktionen und Technologien, die SAP HANA und BW bieten, unter die Lupe genommen.

Bei Business-Intelligence-(BI)- und BW-Initiativen wie auch anderen datenorientierten Vorhaben sind Unternehmen mit bestimmten Herausforderungen an das Daten-Management konfrontiert. Sie können im Wesentlichen in sechs Kategorien unterteilt werden: Performance, Datenqualität, Integration, Bedeutung (= Semantik) herstellen, Sicherheit sowie Datenarchitektur und -management.

Zum Verständnis: Da die Bedeutung der einzelnen Kategorien in der Regel vom jeweiligen Anwendungsfall abhängt, ist deren Darstellung in der nachfolgenden Rangliste subjektiv, da jede Firma unterschiedliche Prioritäten setzt.

1. Performance: Eine hohe Leistungsfähigkeit hängt vom Datenvolumen und der Geschwindigkeit bei Abfragen ab. Läuft das BW-System auf einer traditionellen relationalen Datenbankplattform, kann die Performance durch den Einsatz OLAP-spezifischer Datenbank-Schemata verbessert werden. Läuft das Business Warehouse dagegen auf SAP HANA, wird Datenverarbeitung in der Regel in die In-Memory-Datenbank ausgelagert und dadurch beschleunigt. Eine Ausnahme bildet die Archivierung historischer Daten. SAP HANA gilt inzwischen bei der Datenverarbeitung zwar als das neue „Performance-Monster“ und liefert bemerkenswerte Ergebnisse. In einem HANA-basierten System laufen die meisten Operationen erheblich schneller, aber nicht alle (z.B. geht select* gar nicht).

2. Datenqualität: Zu den schwierigsten Aufgaben beim Daten-Management gehört, konsistente, vollständige und fehlerfreie Daten zu gewährleisten. Das wird unter anderem durch ständiges Testen der einzelnen Datensätze sichergestellt. Doch auch wenn verschiedene Datensätze miteinander kombiniert werden können, muss die konsistente Qualität gewährleistet sein. Denn: Die Höhe der Qualität von miteinander verknüpften Datensätze wird durch die Komponente, welche die geringste Qualitätsstufe hat, bestimmt.

Im BW gibt es verschiedene Funktionen, wie zum Beispiel die Prüfung auf Eindeutigkeit und Integrität, durch deren Einsatz eine hohe Datenqualität erzielt werden kann. HANA dagegen stellt keine nativen Funktionen zur Prüfung der Datenqualität zur Verfügung. Sowohl Business Warehouse als auch SAP HANA lassen sich jeweils mit dem SAP Information Steward als Werkzeug zur Überwachung der Datenqualität integrieren.

Mehr über SAP HANA

Wir beantworten die Frage, ob SAP HANA Business Warehouse ersetzt.

Erfahren Sie, welche drei Möglichkeiten es für die Implementierung von SAP HANA gibt.

Lesen Sie, wie SAP HANA das Daten-Management verändert.

3. Integration: Hierbei sind isolierte Datenquellen wie auch strukturierte und unstrukturierte Daten miteinander zu kombinieren und zu verknüpfen. Anschließend werden die unterschiedlichen Datentypen für Auswertungen in eine Reporting-Lösung geladen. Diese Aufgabe wird häufig mit ETL-Tools (Extract, Transform, Load), wie beispielsweise SAP Data Services oder dem Informatica PowerCenter ausgeführt. Sowohl SAP Business Warehouse als auch SAP HANA unterstützen die SAP Data Services als Lösung für die Datenintegration und -verwaltung und bieten Funktionen zur Kombination von Dateninseln. SAP NetWeaver BW verwendet, um Daten aus einem Quellsystem zu extrahieren, das Konzept der DataSources. In Abhängigkeit vom Quellsystemtyp wird die DataSource im BW-System (bei Nicht-SAP-Quellsystemen) oder direkt im Quellsystem (bei SAP-Quellsystemen) definiert. SAP liefert für das BW über den Business Content bereits vordefinierte DataSources aus.

Ebenso wichtig ist eine unternehmensweite Vereinheitlichung und Integration semantischer Datenkonzepte. Ob in einer Firma zum Beispiel „Umsatz“ für deutsche Mitarbeiter die gleiche Bedeutung hat wie für die Beschäftigten in den USA, hängt von den jeweiligen Erkennungsregeln für die Daten ab, die bei Bedarf entsprechend angepasst werden müssen.

4. Bedeutung: Die Zuweisung von Bedeutung ist wichtig für Anwender, die Daten in einem System nutzen. Daten sind nutzlos, wenn sie keine Bedeutung haben. Ein Datensatz ohne entsprechende Annotationen ist allenfalls für ausgewiesene Datenexperten verständlich, die einen Jahresabschluss oder eine Logistikfunktion allein anhand der Zahlen erkennen. Alle anderen Personen benötigen dafür Hilfe. Dazu können etwa Spalten ausgezeichnet und erkennbare Hierarchien gebildet werden, die Daten zu einem bestimmten Zeitpunkt repräsentieren. Es gibt zudem die Möglichkeit der visuellen Datenexploration und andere Optionen.

Für diese Zwecke bietet SAP HANA lediglich den Zugriff auf Standard-SQL-Abfragen oder Multidimensional Expressions (MDX), einer Programmiersprache für die Abfrage mehrdimensionaler Strukturen (zum Beispiel OLAP-Würfel). Hinzu kommen statistische Funktionen, die aber Experten vorbehalten bleiben. Im Gegensatz dazu bietet Business Warehouse Werkzeuge für Hierarchien, zeitabhängige Daten, Mehrsprachigkeit und den Aufbau leistungsfähiger Abfragen. Sowohl von SAP NetWeaver BW als auch von SAP HANA werden die semantischen Layer in SAP BusinessObjects (sogenannte Universes) unterstützt, die zur Strukturierung von Unternehmensdaten dienen und mit dem Information Design Tool erstellt werden.

5. Sicherheit: In der Regel darf nicht jeder Mitarbeiter auf alle Daten zugreifen. In datenorientierten Systemen basiert die Zugriffsbeschränkung häufig auf den Daten selbst. Zum Beispiel ist der Mitarbeiter Hans Meyer dadurch berechtigt, die Umsatzdaten für Deutschland einzusehen, nicht jedoch die Daten für Tschechien. Diese datenbasierte Zugriffsbeschränkung führt häufig dazu, dass analytische und transaktionale Systeme unterschiedliche Autorisierungskonzepte verwenden. Sowohl Business Warehouse als auch SAP HANA stellen solche analytischen Autorisierungskonzepte bereit, wobei das Konzept des BW-Systems ausgereifter und vorteilhafter ist.

6. Datenarchitektur und -management: Unternehmen, die über eine klar strukturierte IT- und Datenarchitektur verfügen, etwa indem in der Lösungen stets auf die gleiche Art und Weise Daten implementiert, modelliert und beschrieben werden, haben auch das Daten-Management fest im Griff. Zugleich können technologische Änderungen oder neue Architekturanforderungen auf diese Weise effizienter und schneller umgesetzt werden. Soll zum Beispiel das Datenmodell von Sternschemata auf einzelne spaltenbasierte Tabellen umgestellt werden, verringert sich der Arbeitsaufwand deutlich, wenn jedes Schema auf der Grundlage des gleiche Templates erstellt wurde.

SAP BW verlangt Unternehmen hierbei ein hohes Maß an Disziplin und Abstraktion ab. Das gilt speziell dann, wenn es unternehmensweit eine Vielzahl an Data Marts oder verschiedene Data-Warehouse-Installationen gibt. SAP HANA verhält sich hier eher wie eine „normale“ Datenbank und verlangt weit weniger strenge Ordnungen.

Fassen wir die Ergebnisse unserer Betrachtungen zusammen, dann lässt sich folgende Empfehlung aussprechen: Geht es um Aspekte wie Performance, Integration und Sicherheit, ist SAP HANA dafür ausgezeichnet geeignet. Durch den Einsatz der In-Memory-Plattform lässt sich auch ein Teil des Overheads abbauen, der in der Regel mit einer BW-Installation einhergeht. Geht es zusätzlich um Fragen der Architektur, Bedeutung oder Datenqualität, sollte die Unterstützung durch ein SAP Netweaver BW erwogen werden.

Folgen Sie SearchEnterpriseSoftware auf Twitter @sentsoftwarede.

Artikel wurde zuletzt im Januar 2014 aktualisiert

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close