SAP HANA Vora: Die Engine setzt Expertise für Apache Hadoop und Spark voraus

SAP bietet verschiedene Bereitstellungsoptionen für HANA und HANA Vora an. Welche Option sich wofür eignet, hängt vom individuellen Anwendungsfall ab.

Big Data gewinnt immer mehr an Bedeutung, da Unternehmen Erkenntnisse aus ihren strukturierten und unstrukturierten Daten zu Tage fördern möchten, um bessere Entscheidungen treffen zu können.

Damit sie interne und externe Daten analysieren können und Echtzeit-Einsichten erhalten, setzen einige SAP-Anwender sowohl auf HANA, die In-Memory-Plattform des Unternehmens für die Verarbeitung großer Datenmengen, als auch HANA Vora, einem Konnektor zwischen HANA und Hadoop, dem Open Source, Java-basierten Framework für die Verarbeitung großer Datensätze.

HANA Vora ist eine In-Memory Query Engine, die entwickelt wurde, um Big Data von Hadoop besser zugänglich und nutzbar für Unternehmen zu machen. Sie ist an das Apache Spark Framework angestöpselt, was es Unternehmen erlaubt, Daten zu analysieren, die auf Hadoop gespeichert sind.

Die Bereitstellung und Ausführung von SAP HANA oder HANA Vora kann allerdings eine Herausforderung sein. In diesem Kontext gibt es einige Best Practices, die Unternehmen helfen, diese Tools für Big-Data-Projekte vorzubereiten und zu implementieren.

Mit grundlegenden Deployment-Entscheidungen beginnen

Um zu starten, haben Anwender die Optionen, HANA in der Cloud oder On-Premise einzusetzen, sagt Hyoun Park, Chief Research Officer beim Marktforschungsunternehmen Blue Hill Research. Die Entscheidung, welcher Implementierungspfad richtig ist, hängt davon ab, wie man aktuell seine Unternehmensdaten behandelt.

„Wenn ein SAP-Kunde glaubt, dass seine Daten sicher sein müssen oder aus bestimmten Gründen nur im eigenen Land gespeichert werden dürfen, oder wenn er keine starken Cloud-Sicherheits- und Governance-Fähigkeiten besitzt, entscheidet sich der Kunde in der Regel dafür, die HANA-Instanzen und SAP-Daten On-Premise zu halten“, sagt Park.

Dennoch sind viele Unternehmen der Cloud mittlerweile aufgeschlossen und haben ihre Daten sowie Anwendungen bereits in die Cloud migriert, um ihr Business auch in der Cloud gestalten zu können. Daher hängt die Wahl des Bereitstellungsmodells für HANA laut Park von den Präferenzen ab, basierend auf eigenen IT-Standards, der Governance, dem Risiko-Management und der Compliance.

„Darüber hinaus ist es von wesentlicher Bedeutung für eine Organisation, wofür sie HANA einsetzen möchte, bevor sie entscheidet, ob sie HANA in der Cloud oder On-Premise bereitstellt, da unterschiedliche Anwendungsfälle unterschiedliche Plattformen erfordern beziehungsweise für diese optimiert werden müssen“, erklärt Kiersten Williams, Business Analystin bei Panorama Consulting Solutions.

Wenn Unternehmen von älteren SAP-Systemen zu SAP HANA übergehen, müssen sie auch verstehen, dass nicht alle Daten von ihren traditionellen Plattformen auf HANA bewegt werden, sagt Noel Yuhanna, Analyst bei Forrester Research.

„HANA ist eine optimierte Plattform, vor allem bezogen auf Speicher, so dass man nicht einfach alles aus dem alten System auf die HANA-Plattform bewegen kann“, sagt Yuhanna. „Da HANA eine teure Plattform ist, macht es für ein Unternehmen kein Sinn, Daten zu übertragen, die sie nicht verwenden. Deshalb müssen sie planen und die Daten verstehen, die sie auf die HANA-Plattform übertragen.“

Außerdem merkt der Analyst an: „Wenn man seine Daten in HANA nicht kennt, verschwendet man Ressourcen. Das kann extrem kostspielig werden und es könnte sich außerdem nicht lohnen, diese auf HANA zu verarbeiten. Man sollte außerdem wissen, welche Art von Abfragen man benötigt.“

Mit HANA arbeiten ist wie mit einer typischen Datenbank. Die notwendigen Fähigkeiten basieren darauf, womit Datenbank-Administratoren (DBAs) Erfahrung haben. Einen Partner auszuwählen, der einem bei der Implementierung hilft, ist ebenfalls von entscheidender Bedeutung, ist Williams überzeugt. Unternehmen sollten Partner danach aussuchen, wie viel Erfahrung sie in der entsprechenden Branche haben, den Schwerpunkten ihrer Projekte und Empfehlungen früherer Kunden.

Je nach Anwendungsfall, seinem Partner und dem geplanten Kapitalaufwand, sind auch die Bereitstellungsoptionen unterschiedlich, sagt Williams. Für eine Organisation ist wichtig, das richtige interne Team für das Projekt zu finden und ihre technischen sowie organisatorischen Voraussetzungen für den Übergang zu HANA zu bestimmen. Diese Faktoren sollten an mehreren Stellen des Projekts beurteilt werden.

Ein weiterer wichtiger Punkt ist die Speichergröße: die Planung des Speichers, den die Anwendungen erfordern, bilden die Basis für die Hardwareempfehlungen. „SAP hat das Quick Sizer Tool entwickelt, dieses Problem abzumildern, da man damit besser kalkulieren kann“, sagt Williams. „Man sollte darüber hinaus nicht für den aktuellen, sondern für den künftigen Bedarf planen.“

Schließlich sollten Schulungszeiten und -kosten im ursprünglichen Projektbudget berücksichtigt werde, um dessen Erfolg zu gewährleisten.

HANA Vora erfordert Schulungen und Neuausrichtung des Daten- und Analytics Teams

Wenn es um den Einsatz von HANA Vora geht, sollten Organisationen klar ihre Anforderungen für das Projekt definieren, da die Hardwareempfehlungen, die Systemlandschaft und Konfiguration davon abhängt. Der Erfolg der Implementierung baut direkt darauf auf, erläutert die Business Analystin.

Yuhanna stimmt mit Williams darin überein, dass Unternehmen ihre Anforderungen definieren müssen, fügt aber noch hinzu, dass sie HANA nicht einfach nur mit Hadoop und Spark integrieren sollen, weil es den Konnektor gibt.

Mehr zum Thema SAP HANA:

Neue Data-Warehousing-Anwendung: SAP veröffentlicht BW/4HANA.

SAP HANA: Diese Größen bietet SAP für die In-Memory-Datenbank an.

CeBIT 2016: Kontextanalyse mit SAP HANA Vora und Hadoop allgemein verfügbar.

SAP HANA Vora: neue In-Memory-Lösung für Hadoop vorgestellt.

SAP HANA Hadoop Erweiterung: Ein großer Schritt in Richtung Internet der Dinge.

„Ich empfehle, dass Datenarchitekten, welche die HANA Vora-Plattform bauen, einen Blick auf die Anwendungsfälle werfen und was mit der Implementierung von HANA Vora erreicht werden soll“, sagt der Forrester-Analyst. „Wird es zum Beispiel für das Internet der Dinge, Betrugserkennung, Customer Intelligence beziehungsweise Customer Analytics eingesetzt?“

Ein Verständnis der Daten zu haben ist für eine Organisation von zentraler Bedeutung, wenn sie HANA Vora einsetzen möchte, erläutert Shawn Brodersen, Associate Vice President for Application Services beim Systemintegrator HCL Technologies.

„Es ist weniger die Technologie, die zur Barriere für den Geschäftserfolg wird, sondern das Verständnis der Daten einer Organisation und wie sie diese organisieren“, sagt Brodersen. „Wenn man sich die Vora-Hadoop-Landschaft anschaut und versucht, darauf zu implementieren, wird man mit dem Data-Tiering-Konzept konfrontiert, also Hot Data versus Cold Data und wie man darauf zugreift. Man muss eine gute, integrierte Strategie für das Data Lifecycle Management haben.“

Darüber hinaus erfordert die Implementierung von HANA Vora, dass das Unternehmen seine traditionellen Big Data Teams mit den Analytics und Anwendungsteams vereint, die bereits seit längere Zeit in der IT-Abteilung sind. „Vora erfordert die Zusammenarbeit mit dem Big Data Team, das einen Data Scientist oder jemand integriert, der mit Hadoop vertraut ist, da Hadoop andere Fähigkeiten erfordert als traditionelle Datenbanken“, sagt Park.

Mit der jüngsten 125 Millionen Dollar Akquisition von Altiscale, einem Anbieter von Big Data as a Service, hat SAP nun eine bevorzugte Lösung, um Hadoop seinen Kunden anzubieten. Der Deal wird SAP-Anwendern helfen, die damit beginnen wollen, Big Data zu verwenden, da sie nun mit einer Kombination aus Altiscale und HANA Vora arbeiten können, um große Streaming-Datenmengen mit existierenden historischen Daten zu verbinden.

„Wenn Unternehmen den Einsatz von HANA Vora planen, ist es eine gute Gelegenheit für Datenbank-Administratoren zu lernen, wie Apache Sparks arbeitet, da sie damit beginnen müssen zu verstehen, wie Hadoop-basierte Daten verarbeitet und analysiert werden“, erläutert Park.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Erfahren Sie mehr über Datenbanken

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close