alphaspirit - Fotolia

Die Funktionen des Apache Cassandra NoSQL-Datenbank-Management-Systems (DBMS)

Apache Cassandra ist ein Open Source NoSQL-Datenbank-Management-System (DBMS), das für die Verarbeitung sehr große Datenmengen entwickelt wurde.

Apache Cassandra ist ein Open-Source-basiertes, verteiltes NoSQL Datenbank-Management-System (DBMS) für sehr große Datenmengen. Die Daten werden in Schlüssel-Wert-Relationen ablegt. Cassandra ist eine spaltenorientierte Datenbank und gilt in diesem Bereich als populärster Datenspeicher.

Das DBMS wurde ursprünglich bei Facebook für das Inbox-Search-Problem entwickelt und später als Open-Source-Projekt veröffentlicht. Die Implementierung wird als freie Software unter den Bedingungen von Version 2 der Apache-Lizenz verbreitet. Darüber hinaus steht mit der DataStax Community Edition auch bei DataStax eine kostenlose Distribution von Apache Cassandra bereit. Außerdem ist von DataStax eine kommerzielle Edition verfügbar.

Apache Cassandra wurde für Online-Anwendungen erstellt, die eine schnelle Performance und hohe Ausfallsicherheit erfordern. Als Schlüssel-Wert-Datenbanksystem werden Daten als Schlüssel mit dem zugehörigem Wert abgespeichert und abgefragt. Cassandra wurde vor allem entwickelt, um sehr große Datenmengen zu verarbeiten, die auf vielen Standard-Servern verteilt und hochverfügbar sind sowie ohne Ausfallrisiko bereitstehen müssen.

Apache Cassandra ist als Open-Source-Software für die Betriebssysteme Linux, Windows und Mac OS X erhältlich und kann kostenlos heruntergeladen werden.

Features von Apache Cassandra

Grundsätzlich werden Cassandra-Versionen monatlich ausgeliefert. Die aktuelle Versionsnummer von Apache Cassandra ist 3.10. Geradzahlige Releases wie 3.10 stellen dabei neue Features bereit und ungerade Releases Fehlerbehebungen. Die jüngsten Verbesserungen, die mit dem Version-3-Zyklus geliefert wurden, umfassen eine verbesserte Windows-Unterstützung, eine refaktorisierte Storage Engine und Unterstützung für materialisierte Sichten.

Nach dem Herunterladen wird das Apache Cassandra Paket so eingerichtet, dass es auf einem einzigen Knoten läuft. Dieses Setup ist allerdings für den Betrieb von Cassandra nicht typisch. Häufiger wird Apache Cassandra als Multi-Node-Cluster ausgeführt, was zusätzliche Setup-Schritte erfordert. Die Cassandra-Konfigurationsdateien unterstützen beim Einrichten von Clustern sowie bei der Konfiguration des Apache Cassandra NoSQL DBMS.

DataStax Enterprise, das auf Apache Cassandra aufbaut, bietet für Unternehmen eine Multi-Modell-DBMS-Plattform. DataStax Enterprise unterstützt Schlüssel-Wert-, tabellarische, JSON-/ Dokumenten- und Graphdaten-Modelle. Das Design von DataStax Enterprise Graph ist von der Graphdatenbank Titan inspiriert, aber in Cassandra integriert. Da die Daten aus allen Modellen in einer einzigen Persistenzschicht gespeichert sind, erbt jedes Datenmodell sowohl alle Vorteile von Cassandra als auch die Enterprise-Funktionalität von DataStax Enterprise.

DataStax Enterprise ist wie Apache Cassandra für Online-Anwendungen konzipiert, die eine hohe Geschwindigkeit und Verfügbarkeit erfordern, wurde aber um Entwicklungs- und Management-Features für Unternehmen erweitert.

Mehr zum Thema Datenbanksysteme:

Die Funktionen des Aerospike NoSQL-Datenbank-Management-Systems (DBMS).

Crate.io entwickelt mit CrateDB eine SQL-Datenbank für das Internet der Dinge.

Graphdatenbanken festigen enge Beziehungen zwischen Datenelementen.

Die zentralen Funktionen und Features von Datenbank-Performance-Tools.

Kostenloses E-Handbook: Was AWS und Co. für Datenbanken aus der Cloud bieten.

Lizenzierung von Apache Cassandra

Abonnements für DataStax Enterprise sind sowohl für Produktions- als auch für Nicht-Produktionsumgebungen verfügbar. Beide enthalten zertifizierte Software sowie Support von DataStax. In Entwicklungsumgebungen kann DataStax Enterprise frei verwendet werden. Die produktive Nutzung erfordert den Kauf einer Lizenz oder die Registrierung im DataStax Startup-Programm.

Die Teilnahme am DataStax Startup-Programm ist für Startup-Unternehmen mit weniger als zwei Millionen Dollar Jahresumsatz und weniger als 20 Millionen Dollar an Kapital möglich. Das Startup-Programm erlaubt die unbegrenzte, kostenlose Nutzung von DataStax Enterprise. Es gibt weder eine Begrenzung bei der Anzahl der Knoten noch andere versteckte Einschränkungen.

An Support-Diensten stehen bei DataStax zur Verfügung: 24/7/365 Service-Level-Agreements (SLA), zertifizierte Service Packs, die sicherstellen, dass die Software immer auf dem neuesten Stand ist und Hot-Fix-Unterstützung für die Notfallwartung. DataStax ist nicht die einzige kommerzielle Unterstützung für Apache Cassandra, auch andere Unternehmen gewähren Support.

Apache-Cassandra-Datentypen

Das Apache Cassandra NoSQL DBMS unterstützt die gängigsten Datentypen, einschließlich ASCII, Bigint, BLOB, Boolean, Counter, Dezimal, Double, Float, Int, Text, Zeitstempel, UUID, VARCHAR und Varint.

Cassandra ist eine spaltenorientierte NoSQL-Datenbank und bietet entsprechend Spaltenindizes. Die Partitionierung erfolgt hingegen zeilenbasiert. Der Datenzugriff erfolgt mit der Cassandra Query Language (CQL), einer Abfragesprache mit SQL-ähnlicher Syntax.

Apache Cassandra Benchmarks

Ingenieure an der Universität von Toronto führten 2012 einen Benchmark mit NoSQL-Datenbank-Engines durch. Die Tester kamen zu dem Schluss, dass „Cassandras Durchsatz in allen Tests dominierte, aber seine Latenz immer besonders hoch war."

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Erfahren Sie mehr über Datenbanken

- GOOGLE-ANZEIGEN

ComputerWeekly.de

Close