Sergey Nivens - Fotolia

Amazon Neptune: Graphdatenbank für KI-Anwendungen

Die Graphdatenbank Amazon Neptune kann den Status quo bei Graphentechnologien verändern. Vor allem Wettbewerber schauen sich das Angebot genau an.

Amazon Web Services (AWS) taucht seit Ende November mit Amazon Neptune in die Welt der Graphentechnologie ein. Wie alle anderen Ankündigungen des Cloud-Marktführers, erregte auch Neptune große Aufmerksamkeit. Bestehende Anbieter von Graphdatenbanken sind allerdings der Meinung, dass diese Aufmerksamkeit auch gut für sie sein kann.

Im Graphdatenbankmarkt trifft AWS mit Neptune auf einige Wettbewerber. Neben großen relationalen Datenbankanbietern - sowohl IBM als auch Microsoft haben 2017 neue Graphdatenbanken auf Basis von Open-Source-Technologien lanciert – schließt sich Amazon einer Gruppe kleinerer Anbieter von Graphentechnologie an, die der Technologie zu einer höheren Marktdurchdringung verhelfen möchten.

Graphdatenbanken verzichten auf das traditionelle spalten- und zeilenbasierte relationale Datenformat und verwenden stattdessen ein Format, das auf Knoten – oder Entitäten – und Kanten basiert, die Beziehungen verknüpfen. Betrugserkennung, Stammdatenverwaltung und Empfehlungs-Engines sind Bereiche, in denen es immer mehr Anwendungsfälle für Graphen gibt.

Graphen sind eng mit semantischer Technologie verbunden, die darauf abzielt, Bedeutungen in Texten und anderen Datentypen aufzudecken. Neptune kann insbesondere die beiden Hauptströme von Graphdatenansätzen handhaben, da es sowohl Property-Modelle als auch RDF-Mapping-Modelle unterstützt.

Willkommen am Graphenmarkt

Obwohl sie weithin als Start-ups angesehen werden, sind einige Anbieter von Graphentechnologie schon seit geraumer Zeit am Markt vertreten. Frühe und spätere Anbieter scheinen Amazon Neptune auf dem Markt willkommen zu heißen – allerdings mit Vorbehalten.

„Die neue Technologie wird ein besser ausgebildetes Publikum haben“, sagt Yu Xu, Gründer und CEO von TigerGraph, einem Anbieter von Graphdatenbanken, der vor Kurzem ein System veröffentlicht hat, das auf einer parallelen Graphenberechnungs-Engine basiert. Offensichtlich hofft Xu, dass der Eintritt von Amazon in den Graphenmarkt die Akzeptanz von Enterprise-Graphdatenbanken beschleunigt, indem der Cloud-Anbieter mehr Leute darüber informiert.

Wir mögen die Tatsache, dass Amazon Daten in der passenden Form generiert, die wir analysieren können.
Sean MartinCambridge Semantics

„Wir sind der Meinung, dass wir nicht wirklich mit ihnen im Wettbewerb stehen“, sagt Sean Martin, CTO bei Cambridge Semantics, das im vergangenen Jahr eine In-Memory-Massively-Parallel-Processing (MPP)-Graphdatenbank-Engine zu seiner bestehenden semantischen Softwarelinie hinzugefügt hat. „Wir mögen die Tatsache, dass ihr System Daten in der passenden Form generiert, die wir analysieren können.“

Laut Emil Eifrem, CEO von Neo4j, der die Entwicklung von Graphdatenbanken seit mehr als zehn Jahren vorantreibt, ist der Schritt von Amazon ein klares Bekenntnis zu Graphenkonzepten: „Nun scheint es so, als hätte jeder Software-Riese ein Graphenangebot. Das einzige Unternehmen, das bisher gefehlt hat, war Amazon. Das ist eine massive Bestätigung.“

Eifrem sagt, dass die Neo4j-Datenbankplattform, die in der jüngsten Version einen Konnektor zur Analyse-Engine von Apache Spark spendiert bekam, weiterhin die Verwendung der deklarativen Programmiersprache Cypher hervorheben wird, die in ihren Fähigkeiten mit SQL vergleichbar ist.

Einer der ersten Anbieter von NoSQL-Datenbanken, MarkLogic, schloss sich 2013 offiziell der Graphenbewegung an, als er SPARQL-Abfragen und RDF-Unterstützung für seine MarkLogic Server-Software einführte.

Die Unterstützung von SPARQL und RDF durch Amazon Neptune wird laut Joe Pasqua, Executive Vice President bei MarkLogic, das Bewusstsein für eine solche semantische Software erhöhen. Er geht jedoch davon aus, dass die Implementierung von Neptune „möglicherweise nicht gut bei CIOs in Unternehmen ankommen wird“, die mit sensiblen und regulierten Daten arbeiten müssen.

Anwendungsfälle entdecken

Da es immer mehr unstrukturierte Daten gibt und Data Scientists daran arbeiten, neue Zusammenhänge innerhalb von Datenbanken zu entdecken, haben sich Graphenansätze durchgesetzt. Es gibt Anzeichen für ein größeres Interesse an Graphentechnologien in Unternehmen.

„Die Leute entdecken Anwendungsfälle, die zunehmend mit Graphentechnologie adressiert werden. Das schließt Dinge wie Social-Media-Analysen und Anomalieerkennung ein. Aufgrund der Vielseitigkeit der Anwendungsfälle kann das Finden der passenden Graphdatenbank allerdings eine Reise sein“, ist Gartner-Analyst Nick Heudecker überzeugt.

„Es ist eine interessante Herausforderung, herauszufinden, wann ein Graph eine gute Lösung ist. Niemand sagt: Ich habe ein Graphenproblem“, erläutert er. „Doch Sie erkennen, wenn zum Beispiel eine logistische Herausforderung vorliegt, dass Graphen hierbei helfen können.“

Künstliche Intelligenz und Machine Learning

„Während relationale Datenbanken eine Art Graphenverarbeitung erreichen, können die dedizierten Graphenplattformen, die sich herausgebildet haben, Benutzer besser dabei unterstützen, größere Graphen zu verarbeiten, wie es bei vielen Analyseaufträgen der Fall ist“, sagt Heudecker. Er verweist zum Beispiel auf die großen Datenkohorten bei Machine-Learning-Daten als geeigneten Anwendungsfall für den Datenbanktyp.

„Graphdatenbanken haben das Potenzial, in neuen KI-Anwendungen eine Rolle zu spielen. Wir sehen sie als Teil einer effektiven KI-Anwendung“, sagt David Schubmehl, Analyst beim IT-Marktforschungsunternehmen IDC. Er merkt zudem an, dass das, was er als Knowledge Graphs (Wissensgraphen) bezeichnet, mittlerweile in der Liste der zu beobachtenden KI-Technologien von IDC enthalten ist.

Graphdatenbanken haben das Potenzial, in neuen KI-Anwendungen eine Rolle zu spielen. Wir sehen Graphdatenbanken als Teil einer effektiven KI-Anwendung.
David SchubmehlIDC

Für Amazon ist laut Schubmehl die Umstellung auf Graphdaten Teil eines größeren Ziels: „Amazon versucht, die Leistung und den Betrieb von Machine-Learning-Modellen auf ihrer Hardware und Cloud-Infrastruktur zu erleichtern. Ihre jüngsten Ankündigungen zeigen, dass sie die dafür notwendigen Werkzeuge und Infrastrukturen bereitstellen.“

Wenige unterschätzen die potenziellen Auswirkungen von Amazon, da mehr datenorientierte Arbeit in die Cloud wandert. Amazon hat in den zurückliegenden Jahren mit einer Vielzahl neuer Cloud-Datenbanken immer mehr an Einfluss gewonnen.

Amazon Neptune schließt sich der relationalen Datenbank Aurora, der Query Engine Athena, der NoSQL-Datenbank DynamoDB, dem Data-Warehouse-Service Redshift, Simple Storage Service (S3) und anderen Elementen des AWS-Portfolios an. Außerdem hat Amazon vor Kurzem das Machine-Learning-Entwicklungswerkzeug SageMaker hinzugefügt.

Auch wenn die bestehenden Player davon profitieren, dass Amazon mehr Aufmerksamkeit auf Graphen lenkt, müssen sie auch schnell sein. Die Herausforderung, die Amazon ihnen stellt, bezieht sich weniger auf Neptune als vielmehr auf die Amazon-Angebote insgesamt. Anders ausgedrückt: Es geht um eine allgemeine, weitreichende Integration bei Amazon im Vergleich zu spezieller, Best-of-Breed-Software bei klassischen Anbietern. Den etablierten Anbieter von Graphentechnologie sind diese Herausforderungen aber bereits bekannt.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Pro und Contra: Native versus nicht-native Graphdatenbanken.

Graphdatenbanken festigen enge Beziehungen zwischen Datenelementen.

Graphdatenbank Titan in der AWS-Cloud verwenden.

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close