Wie geeignet ist der Oracle Exadata Storage Server?

Für neue Data Warehouse-Anwender, die auf der Suche nach einer Einstiegslösung sind, sollten sich Oracle Exadata Storage Server näher anschauen.

Es ist ein halbes Jahr her, dass Larry Ellison auf der Open World 2008 Oracle Exadata Storage Server und HP Oracle Database Machine vorgestellt hat. Zahlreiche Publikationen haben sich der Lösungsarchitektur gewidmet, die sich aufgrund ihrer Andersartigkeit im Vergleich zu bislang verfügbaren Data Warehouse Appliances nicht für jeden sofort erfassen lässt. 

Für Entscheider ist indes die Architektur nicht per se kaufrelevant. Vielmehr spielt die Leistungskraft in Relation zu den Gesamtkosten die zentrale Rolle, und das projiziert natürlich auf die Anforderungen des Unternehmens.

Weshalb Exadata?

Oracle hat mit der Auslieferung von Exadata auf einen Markt reagiert, der bereits seit einigen Jahren in Bewegung geraten ist. Wachsende Datenmengen und erweiterte funktionale Anforderungen bei Data Warehouse Anwendungen setzen DBMS Anbieter nämlich zunehmend unter Druck. 

Neue Datenbankangebote für analytische Applikationen reichen von vorkonfigurierte, für den Einsatzzweck optimierte Hardware-/Software-Kombinationen auf Basis etablierter Technologien bis hin zu gänzlich neuen Lösungsansätzen von bislang unbekannten Anbietern. Hier wird häufig von „Data Warehouse Appliances“ gesprochen. Gemeinsam verfolgen diese Konzepte folgende Strategien:

  • Steigerung der Hardware-Leistung mittels hochgradiger Parallelität auf Basis von scale-up und scale-out Architekturen sowie optimal aufeinander abgestimmte Systemkomponenten;
  • Reduktion der zu bewegenden Datenmengen, um die notwendigen I/O-Operationen zu reduzieren – diese gelten nämlich als Flaschenhals der Datenbank-Operationen;
  • Vereinfachung der Systemverwaltung durch Reduktion der notwendigen Konfigurationsmaßnahmen zwecks Einsparung von Zeit und Personalressourcen.

Die Newcomer am Markt, wie beispielsweise Netezza (Netezza Performance Server) und Kognitio (Kognitio WX2) haben als Zielkunden bislang vor allem Oracle Anwender im Visier. Experten argumentieren, dass das Angebot von Oracle in den oben genannten Bereichen Schwächen aufweist, die vornehmlich bei Data Warehouses 10TB zum Tragen kommen. 

Insofern kann das Erscheinen von Exadata als Antwort auf diese Kritik verstanden werden. Das lässt aber gleichzeitig die Frage aufkommen, inwiefern Exadata, mit oder ohne Database Machine, sich eignet, um alle vorhandenen Schwachpunkte zu adressieren. Dabei interessieren folgende Detailfragen ganz besonders:

  • Ist das Exadata-Konzept zur Lösung aller analytischen Anforderungen geeignet?
  • Exadata gilt als Kostenintensiv. Lassen sich durch den Einsatz von Exadata auch Kosten einsparen, die diese Investitionen rechtfertigen?

Beispielhafte Messergebnisse

Im Rahmen des Oracle Exadata Betatests wurde es ausgewählten Kunden möglich gemacht, in speziellen Testzentren die neue Infrastruktur zu prüfen. Im hier betrachteten Fall wurde der Test im Oracle ETC in Reading (UK) durchgeführt. 

Es wurden Original-Daten aus der produktiven DWH-Umgebung des Kunden verwendet. Die Test-Hardware bestand aus der Standard HP Oracle Database Machine, allerdings mit 300GB-SAS-Platten. Die Systemkonfiguration wurde von Oracle ohne Beteiligung des Kunden durchgeführt. Mitarbeiter des Kunden reisten zur Testdurchführung in das Testzentrum.

Oracle hat mit der Auslieferung von Exadata auf einen Markt reagiert, der bereits seit einigen Jahren in Bewegung geraten ist.

In dem Anwendungsfall handelt es sich um typische Abfragen aus dem analytischen CRM. Der Datenbestand weist Kaufverhalten von sehr vielen Kunden aus, und zwar über eine große zeitliche Historie. Die Test-Abfragen und deren Filter operieren auf Detaildatenebene, und spiegeln vor allem die Anforderungen komplexer Analytik im Sinne von Scoring wider.

In den Fällen, wo Vergleichswerte aus der Originalumgebung vorhanden sind, ist die Verbesserung der Abfragezeit dazu deutlich erkennbar. Zu berücksichtigen ist dabei, dass die aktuelle Produktivumgebung des Kunden auf zwischenzeitlich leicht überholter Hardware basiert.

Im Testfall Scoring mit und ohne Statistik handelt es sich um die Erzeugung einer Ergebnistabelle mit den Scoring Ergebnissen, die Basis einer Folgeabfrage ist. Der Testfall ohne Indexerstellung weist ein besseres Messergebnis aus. Dies kann als Indiz dafür gelten, dass mit Exadata potenziell weniger Indizes benötigt werden.

In einem weiteren Fall hat Winter Corporation in Kooperation mit Oracle ein Benchmark erstellt und die Ergebnisse im Rahmen eines White Papers zur Verfügung gestellt. Dem Test lag ebenfalls eine Standard HP Oracle Database Machine Hardware zugrunde. Kern des Tests war es vor allem, den erreichbaren I/O-Durchsatz zu messen.

Im Testfall wird kein Vergleich zwischen Exadata und einer klassischen Oracle Implementierung gezogen. Vielmehr werden vier analytische CRM Abfragen zunächst sequentiell, im zweiten Schritt parallel gegen den Datenbank-Server abgesetzt. Die vier Abfragen enthielten Filterbedingungen sowohl auf Detaildatensätze als auch auf gruppierte Ergebnismengen.

Exadata zeigte hierbei unter paralleler Last einen recht kontinuierlich hohen I/O-Durchsatz. Bei der sequentiellen Abwicklung betrug die Gesamtlaufzeit 126 Sekunden. In etwa 4% der Gesamtlaufzeit wurde der maximale I/O-Durchsatz eines Exadata Storage Servers von 14 GB/s erreicht, in etwa einem Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s. 

Bei der parallelen Abwicklung betrug die Gesamtlaufzeit 99 Sekunden, eine Verbesserung von 21% gegenüber der sequentiellen Variante. Zu etwa zwei Drittel der Gesamtlaufzeit lag der I/O-Durchsatz zwischen 10 und 14 GB/s.

Es erscheint zwar theoretisch möglich, einen solchen Durchsatz auf Basis konventioneller Speicherlösungen zu erreichen. Der Umfang der dediziert einzusetzenden Hardware würde nach Winter jedoch aufgrund des Bedarfs an Standplatz, Betriebs- und Kühlenergie vermutlich wesentlich höhere Kosten implizieren als die getestete HP Oracle Database Machine. Zudem bietet die Infrastruktur bei Bedarf noch Erweiterungsoptionen.

Das White Paper geht nicht darauf ein, wie sich der erreichte I/O-Durchsatz auf die Leistungen des Datenbankserver auswirkt. Es werden keine Aussagen getroffen hinsichtlich Verwendung von Indizes oder Aufwände zur Systemkonfiguration. Allerdings weist Winter darauf hin, dass einige der verwendeten Abfragen mit Hilfe des Oracle SQL Tuning Advisor optimiert wurden.

Die Testergebnisse lassen zusammen betrachtet folgende Arbeitsthesen zu:

  • Exadata mit dem SmartScan macht bislang nicht durchführbare Abfragen möglich, liefert aber nicht für jede Abfrage einen signifikanten Mehrwert;
  • Der SQL Tuning Bedarf stellt die Einsatzfähigkeit von Exadata im Rahmen von BI-Werkzeugen einer Bewährungsprobe aus, schließlich ist das von diesen Werkzeugen generierte SQL nur teilweise konfigurierbar;
  • Leistungs- und Skalierfähigkeit von Exadata und Database Machine lassen im Vergleich zu konventionellen HW-Konfigurationen mögliche Vorteile hinsichtlich Betriebskosten und Flexibilität erkennen;
  • Modernste, optimal konfigurierte HW kann eine günstigere Alternative zu Exadata und/oder der Database Machine sein.

Mögliche Kostenrechnung

Eine offizielle Listenpreisliste für Exadata und Database Machine für 2008 kann hier eingesehen werden. Hier eine Zusammenfassung:

In diesen Angaben nicht enthalten sind die Kosten für die Software des Datenbank-Servers. Unterstellt man die Standard-HW-Konfiguration der HP Oracle Database Machine wie empfohlen, belaufen sich die Gesamtkosten auf $650.000 für Hardware und etwa $1.700.000 für die Exadata Software (inkl. Support etwa $2.000.000). Hinzu kommen die Datenbank-Software-Lizenzen für das RAC Cluster der Database Machine.

Mögliche Zielszenarien

Schon allein auf Grund der recht hohen Investitionskosten wird Oracle Exadata (mit oder ohne HP Oracle Database Machine) vor allem von bestehenden Oracle Kunden erwogen werden, die in ihrem Data Warehouse hohe Skalierungsanforderungen auf Basis sehr großer Datenvolumen zu befriedigen haben. 

In manchen Fällen wird es erst mit Einsatz von Exadata überhaupt gelingen, umfangreiche und komplexe Abfragen erfolgreich durchzuführen.

Dies spiegelt jedoch nicht die Bedürfnisse durchschnittlicher Oracle-Data-Warehouse-Anwender wider. Selbst bei großen Datenmengen im historisierten Warehouse greifen nicht alle Abfragen auf alle Zeitscheiben zu, entsprechen nicht alle Abfragen der analytischen Komplexität von Scoring. 

Eine pauschale Antwort auf die Eignung von Exadata zur Lösung der analytischen Anforderungen des Unternehmens kann daher nicht geliefert werden. Es gilt, die unternehmensspezifische, analytische Arbeitslast zu ermitteln und im Rahmen eines Tests zu prüfen. Hier sollte unbedingt auch auf die im Unternehmen eingesetzten BI-Werkzeuge zurückgegriffen werden.

Sehr schwierig zu beziffern ist weiterhin, welche Kosten-einsparung sich durch den Einsatz von Exadata erzielen lässt.

Sehr schwierig zu beziffern ist weiterhin, welche Kosteneinsparung sich durch den Einsatz von Exadata erzielen lässt, etwa durch Einsparung von Betriebskosten (Hardware, Standplatz, Strom) oder Ressourcen im Rahmen des Tunings. Zudem gibt es Hardware Alternativen zur Database Machine. 

Exadata lässt sich auch in anderen Infiniband-fähigen Hardwarekonfigurationen einsetzen. So ist es beispielsweise denkbar, zugunsten reduzierter DB-Lizenz-Kosten auf den Einsatz eines RAC-Datenbankclusters zu verzichten. Gleichzeitig bleibt in der Praxis abzuwarten, welche zusätzliche Komplexität der Einsatz von Exadata mit sich bringt.

So bleibt Oracle-Warehouse-Anwendern eine Fülle von Handlungsoptionen, die es individuell zu prüfen gilt. Für neue Data-Warehouse Anwender, die auf der Suche nach einer Einstiegslösung sind, erscheint die Oracle-Lösung jedoch nur als eine Lösung unter vielen. Mit der Gesamtkomplexität und die recht hohen Listenpreise steht die Lösung einem bunten Markt von möglichen Alternativangeboten gegenüber.

Die knapp 30-seitige Kurzevaluation von Oracle Exadata Storage Server und HP Oracle Database Machine wird in Kürze im Rahmen der BARC Software-Evaluation Data Warehousing und Datenintegration veröffentlicht. Die Studie bietet auch Vergleiche mit anderen Lösungsangeboten.

Über den Autor:
Jacqueline Bloemen ist Geschäftsführerin der BeKS (Business eKnowledge Solutions) sowie Senior Analystin Data Warehousing und Business Intelligence für BARC (Business Application Research Center). Als Beraterin und Coach unterstützt sie seit rund 20 Jahren Unternehmen verschiedener Branchen und Größen bei der IT Strategie- und Architekturentwicklung für Business Intelligence, Data Warehousing und Datenintegration. Hierzu zählen auch Technologie- und Architekturauswahl, Projektplanung und Durchführung basierend auf Best Practices, sowie Performance Optimierung für komplexe und umfangreiche Datenmanagementlösungen. Neben den umfangreichen Erfahrungen mit BI-Systemen und deren Implementierung unterstützt sie als langjährige Beobachterin und Beraterin des BI-Softwaremarktes internationale Anwendergemeinden mit Vorträgen, Erfahrungsberichten und Studien.

Folgen Sie SearchEnterpriseSoftware.de auch auf Facebook, Twitter und Google+!

Artikel wurde zuletzt im Januar 2009 aktualisiert

Erfahren Sie mehr über Business-Software

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close