Definition

Databricks

Databricks ist eine Organisation und Plattform für die Verarbeitung großer Datenmengen, die von den Schöpfern von Apache Spark gegründet wurde. Databricks soll eine Alternative zum MapReduce-System bieten und stellt eine Cloud-Plattform für Big Data Processing Clients bereit.

Databricks wurde für Datenwissenschaftler, Ingenieure und Analysten entwickelt, um Anwender zu unterstützen, die Bereiche Datenwissenschaft, Technik und das dahinter stehende Geschäft über den Lebenszyklus des maschinellen Lernens hinweg zu integrieren. Diese Integration trägt dazu bei, die Prozesse von der Datenaufbereitung bis hin zu Experimenten und der Bereitstellung von Machine-Learning-Anwendungen zu vereinfachen.

Nach Angaben des Unternehmens ist die Databricks-Plattform hundertmal schneller als das Open-Source-System Apache Spark. Durch die Vereinheitlichung der Pipeline, die mit der Entwicklung von Machine Learning Tools verbunden ist, soll Databricks die Entwicklung beschleunigen und die Sicherheit erhöhen. Datenverarbeitungscluster können mit nur wenigen Klicks konfiguriert und bereitgestellt werden. Die Plattform umfasst verschiedene integrierte Datenvisualisierungsfunktionen zur grafischen Darstellung von Daten.

Databricks hat seinen Hauptsitz in San Francisco, Kalifornien, und wurde von Ali Ghodsi, Andy Konwinshi, Scott Shenker, Ion Stoica, Patrick Wendell, Reynold Xin und Matei Zaharia gegründet.

Diese Definition wurde zuletzt im März 2023 aktualisiert

Erfahren Sie mehr über Big Data

ComputerWeekly.de
Close