Definition

Apache HBase

Apache HBase ist ein spaltenorientierter Key-Value-Data-Store, der entwickelt wurde, um mit dem Hadoop Distributed File System (HDFS) zusammenzuarbeiten. Hadoop ist ein Open-Source-Framework für die Verarbeitung großer Datenmengen in einer verteilten Rechenumgebung.

HBase wurde entwickelt, um hohe Raten bei Tabellenaktualisierungen zu unterstützen und horizontal in verteilten Rechen-Clustern (Hadoop-Clustern) zu skalieren. Die Fixierung auf Skalierung ermöglicht sehr große Datenbanktabellen, zum Beispiel mit mehreren Milliarden Zeilen und mehreren Millionen Spalten. Derzeit ist einer der bekanntesten Anwendungsfälle von HBase der strukturierte Data Handler für die Nachrichteninfrastruktur von Facebook.

Apache HBase bietet eine starke Datenkonsistenz für das Lesen und Schreiben von Daten, was es von anderen NoSQL-Datenbanken unterscheidet. Ähnlich wie bei Hadoop, ist einer der wichtigsten Aspekte der HBase-Architektur die Verwendung von Master Nodes, um lokale Server zu verwalten, die Teile der Tabellen verteilen und verarbeiten.

HBase ist Teil einer langen Liste von Add-ons für Apache Hadoop, zu der unter anderem auch Hive, Pig and ZooKeeper gehören. Wie Hadoop ist HBase typischerweise mit Java programmiert und nicht SQL. Da HBase ein Open-Source-Projekt ist, wird die Entwicklung von der Apache Software Foundation überwacht. Seit 2010 ist HBase eines der Top-Level-Projekte von Apache.

Diese Definition wurde zuletzt im Oktober 2015 aktualisiert

Erfahren Sie mehr über Datenverwaltung

ComputerWeekly.de
Close