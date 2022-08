Die Apache Software Foundation stellt verschiedene Datenbanklösungen zur Verfügung, mit denen sich strukturierte und unstrukturierte Daten speichern lassen. Wir stellen in diesem Beitrag einen Überblick zur Verfügung.

Im Beitrag Big-Data-Analysen mit Tools der Apache Software Foundation haben wir bereits Apache-Lösungen vorgestellt, mit denen sich Big Data analysieren lässt. Einige dieser Lösungen dienen ebenfalls der Datenspeicherung, darunter Accumulo, Beam, Drill, Flink oder Calcite.

Apache Daffodil

Bei Daffodil handelt es sich um eine Open-Source-Implementierung der Data Format Description Language (DFDL). Diese kann verschiedene Datenformate beschreiben, einschließlich textueller und binärer, wissenschaftlicher und numerischer, datensatzorientierter, industrieller und militärischer Standards. Die verwendete Sprache ist Teil des W3C XML-Schemas, um das logische Format der Daten zu beschreiben.

Abbildung 1: Die Apache Foundation umfasst verschiedene Datenbanken und Lösungen für die Datenverwaltung, zum Beispiel Apache CouchDB.

Das ermöglicht das Parsen von Daten in festen Formaten über ein Infoset. Hier besteht die Möglichkeit, die Daten in XML oder JSON zu konvertieren. Zusätzlich kann Daffodil Daten serialisieren und wieder in das Quellformat umwandeln. Datenverarbeitungs-Frameworks ermöglichen das Konvertieren in Datenstrukturen bei gleichzeitiger Umgehung des XML/JSON-Overheads.