BillionPhotos.com - stock.adobe.

Was sind die Unterschiede von Grafana und Datadog?

Grafana und Datadog ermöglichen umfassendes Monitoring und Observability, sammeln Daten aus verschiedenen Quellen und liefern wertvolle Einblicke in Systeme und Anwendungen.

Mit Überwachungs-Tools lassen sich Probleme leichter beheben, der Zustand und die Sicherheit eines laufenden Systems besser verstehen und sogar Verbesserungen an diesem System planen, die sich auf dessen Leistung auswirken würden.

Grafana und Datadog sind zwei verschiedene Tools, die Sie zu Überwachungszwecken sowie zur Nutzung und Visualisierung von Informationen aus verschiedenen Protokollierungsdiensten sowohl On Premises als auch in der Cloud einsetzen können.

Heute werden diese Tools zunehmend im Kontext von Observability verwendet, was neben dem Monitoring auch die Erfassung und Analyse von Metriken, Logs und Traces umfasst.

Ob eines dieser Tools für die Überwachung Ihrer Anwendung und der Infrastruktur, auf der sie läuft, nützlich sein könnte, hängt vom Budget, den Zeitplänen und der Größe Ihres Unternehmens ab. Unabhängig davon, für welches Tool Sie sich entscheiden, müssen Sie viel Zeit für die Konfiguration der einzelnen Datenquellen, Dashboards und Alarme aufwenden. Sobald Sie eines der beiden Tools vollständig konfiguriert haben, erhalten Sie einen leistungsstarken Einblick in Ihre Anwendung und Infrastruktur.

Logging einrichten

Das Einrichten von Logging sieht für jeden anders aus, aber der erste Schritt besteht darin, eine Art Logging-Agent oder -Dienst zu konfigurieren. Wenn Sie noch nichts eingerichtet haben, konfigurieren Sie dies zuerst.

Wenn Sie AWS, Azure oder Google Cloud verwenden, nutzen Sie Amazon CloudWatch, Azure Monitor oder Google Cloud Logging. Seit 2024 bieten alle drei Plattformen auch eine native Unterstützung für das OpenTelemetry-Protokoll, mit dem sich Logs, Metriken und Traces standardisiert erfassen und weiterleiten lassen.

Wenn Sie Kubernetes verwenden, setzen sich Tools wie Fluent Bit oder Vector als Standard für das Erfassen von Container-Logs durch, um Protokolle aus Ihrem Cluster zu lesen. Wenn Sie On Premises arbeiten, eignet sich Elasticsearch mit Logstash oder Prometheus, um Ereignisse und Metriken aus jeder Instanz zu erfassen.

Sowohl Grafana als auch Datadog bieten Optionen zum Einrichten der Instanzprotokollierung über die Befehlszeile, wenn Sie keine zusätzlichen Dienste einrichten möchten.

Unabhängig davon, welche Plattform Sie verwenden, gibt es sowohl in Grafana als auch in Datadog Plug-ins und Integrationen, die die Daten erfassen, aggregieren und in einem Diagramm darstellen oder einen Alarm auslösen können. Der Kern jedes Überwachungs-Tools basiert auf den Protokollen, die es überwacht.

Grafana

Nachdem Sie nun über zu analysierende Protokolle verfügen, besteht der nächste Schritt darin, ein Tool für die Arbeit auszuwählen. Eine Option ist Grafana. Grafana bietet mehrere verschiedene Optionen für die Einrichtung, darunter die folgenden:

  • Installation unter Linux, macOS oder Windows
  • Docker oder Docker Compose
  • Grafana Cloud, ein von Grafana Labs verwaltetes SaaS-Angebot
  • Marktplatzangebote bei allen großen Cloud-Anbietern

Die Anweisungen und Preise variieren je nachdem, wie Sie Grafana installieren möchten. Jeder Schritt ist in einer ausführlichen Dokumentation beschrieben.

Beispielsweise sind in der kostenlosen Version von Grafana Metrics zehntausend aktive Serien pro Monat inkludiert, sowie eine Aufbewahrungsdauer von 14 Tage und Support durch die Community. Die Pro-Version kostet eine Plattformnutzungsgebühr von 16,40 Euro (19 US-Dollar) und bietet 13 Monate Aufbewahrung so wie einen 8x5-E-Mail-Support. Wenn man über die zehntausend aktiven Serien hinausgeht, kommen Gebühren von etwa 5,60 Euro (6,50 US-Dollar) pro 1000er Serie dazu. Die Enterprise-Version hat eine Minimalverpflichtung von etwa 21.600 Euro (25.000 US-Dollar), die Aufbewahrungsdauer wird selbst entschieden, es gibt einen Premium-Support sowie einen Observability Architect. Auch die Bereitstellung ist frei entscheidbar, etwa über Public Cloud, Federal Cloud oder eine Private Cloud. Der Preis pro 1000er wird anhand der jährlichen Mindestabnahme und Mengenrabatten berechnet.

Unabhängig davon, für welche Option Sie sich entscheiden, gelangen Sie zu einer Startseite, die der hier gezeigten ähnelt.

Startseite von Grafana
Abbildung 1: Das ist die Startseite von Grafana.

Die Screenshots und Beispiele in diesem Artikel verwenden Docker Compose und stellen eine Verbindung zu lokal gehosteten Linux-VMs und AWS her. Jedes Angebot kann auf die gleiche Weise konfiguriert werden. Sobald Sie sich auf der Startseite befinden, müssen Sie zwei Dinge tun: Datenquellen hinzufügen und Dashboards erstellen.

Datenquellen

Die zuvor eingerichteten Protokollierungs-Tools sind die Datenquellen, die Ihr Grafana-Dashboard versorgen. Öffnen Sie das Menü Home oben links auf dem Bildschirm. Navigieren Sie dann zu Connections\Data Sources und fügen Sie eine neue Datenquelle hinzu.

Dieses Menü zeigt, welche Plug-ins für die verschiedenen Protokollierungs- und Überwachungsdienste verfügbar sind, aus denen Grafana Dashboards erstellen kann. Hier stehen mehrere Optionen zur Auswahl. In diesem Artikel liegt der Schwerpunkt auf AWS und dem Linux-Server-Protokollierungs-Tool Loki von Grafana Labs.

Serverprotokollierung

Loki ist ein Serverprotokollierungsprogramm, das Sie als Agent auf einer Linux-VM aus den Paketmanagern apt und dnf installieren oder in einem Docker-Container zusammen mit Grafana ausführen können. Seit Version 3.0 (2024) unterstützt Loki nativ OpenTelemetry und kann Logs aus verteilten Systemen wesentlich effizienter aggregieren. Sobald Sie Grafana konfiguriert haben, werden die Systemprotokolle an Grafana gesendet, wo sie angezeigt werden können.

Anzeige Systemprotokolle
Abbildung 2: Grafana zeigt die Systemprotokolle an.

AWS

CloudWatch hat bereits mit minimaler Konfiguration Zugriff auf verschiedene Metriken aus Ihrem AWS-Konto. Praktisch jedes Ereignis oder Protokoll aus jedem AWS-Dienst kann an CloudWatch gesendet werden. Mehrere Dienste protokollieren standardmäßig Ereignisse in CloudWatch.

Um CloudWatch in Grafana zu konfigurieren, müssen Sie einen AWS-IAM-Prinzipal (Identity and Access Management) für Ihr Grafana-Dashboard erstellen. Dies kann entweder eine Rolle oder ein Benutzer mit einem Zugriffsschlüssel und einem geheimen Zugriffsschlüssel sein. Sobald dies erledigt ist, können Sie die Details für diese Rolle oder die Zugriffsschlüssel für den Benutzer auf der Datenquellen-Seite in Grafana eingeben.

Sobald Sie eine dieser Datenquellen konfiguriert haben, können Sie mit Grafana die darin enthaltenen Daten untersuchen, indem Sie SQL-ähnliche Abfragen für diese Daten erstellen. Auf diese Weise können Sie Ansichten für bestimmte Informationen in diesen Protokollen erstellen. Alternativ können Sie auch Grafana Explore nutzen, um Daten interaktiv zu durchsuchen und zu filtern, ohne vorher komplexe Abfragen schreiben zu müssen.

Dashboards

Sobald Sie über Datenquellen verfügen, die Protokolle an Grafana senden, können Sie einige Dashboards erstellen. Grafana verfügt standardmäßig über keine Diagramme für Datenquellen. Verwenden Sie stattdessen SQL-Abfragen, um die eingehenden Daten aus jeder Datenquelle zu analysieren. Wenn Sie keine Zeit mit der Konfiguration eines Dashboards verbringen möchten, können Sie Vorlagen für gängige Dashboards aus der Community importieren.

Diese Vorlagen können ein guter Ausgangspunkt sein. Selbst wenn ein Dashboard nicht genau Ihren Anforderungen entspricht, können Sie es nach dem Import anpassen. Es gibt Community-Dashboards für viele verschiedene Anwendungsfälle, darunter Cloud-Abrechnung, Storage-Nutzung und Bereitstellungsüberwachung.

CloudWatch-Daten
Abbildung 3: Hier werden CloudWatch-Daten genutzt, um geschätzte Abrechnungskosten pro Dienst abzubilden.

Es kann eine Herausforderung sein, Dashboards aus SQL-Abfragen von Grund auf neu zu erstellen. Wenn Sie sie jedoch als Vorlagen speichern, können Sie sie leicht versionieren, im Laufe der Zeit verbessern und auch mit anderen Benutzern und Organisationen teilen, die Grafana verwenden und möglicherweise ähnliche Anforderungen haben.

In neueren Versionen steht die die Funktion Unified Observability in Grafana Cloud zur Verfügung, mit der sich Logs, Metriken und Traces in einer einzigen Ansicht kombinieren lassen, was ein großer Vorteil bei komplexen Microservice-Architekturen ist.

Preise

Grafana bietet alle seine Grafana-Cloud-Produkte einzeln und in drei verschiedenen Stufen mit unterschiedlichem U/nfang und Support an. Die kostenlose Stufe verspricht nur einen Community Support, die Pro-Version Support über E-Mail und die Enterprise-Version einen Premium-Support. Die Preise sind meist entweder nutzungs- oder zeitraumbasiert. Zusätzlich gibt es modulare Add-ons (zum Beispiel für Machine-Learning-basierte Anomalieerkennung oder Security-Monitoring), die separat abgerechnet werden können.

Datadog

Während Grafana On Premises oder in einer vollständig isolierten Umgebung eingerichtet werden kann, muss Datadog an seine Cloud-Plattform zurückmelden, wo alle Verwaltungs- und Konfigurationsarbeiten durchgeführt werden.

Es unterscheiden sich die Anforderungen an die Schnittstelle und die Konnektivität von Grafana und Datadog. Auch Datadog bietet mehrere verschiedene Dienste an, die Sie abonnieren können. Je nachdem, für welche Dienste Sie sich entscheiden und wie oft Sie diese nutzen, variiert der Preis, den Sie für Datadog zahlen. Seit 2025 gibt es ein kostenloses Starter-Tier mit einem zweiwöchigen Testzeitraum für kleine Projekte sowie neue KI-gestützte Analysefunktionen wie Datadog Watchdog, das Anomalien automatisch erkennt und Handlungsempfehlungen gibt.

Datenquellen

Datadog verfügt über mehrere der gleichen Integrationen wie Grafana. Diese Integrationen werden auf die gleiche Weise konfiguriert. Beispielsweise kann eine AWS-Integration entweder eine IAM-Rolle oder einen Benutzer mit Zugriffsschlüsseln verwenden. Wenn Sie einzelne VMs verbinden, stellt Datadog einen Agenten zur Verfügung, der mit einem einzigen CLI-Befehl installiert werden kann.

Im Vergleich dazu ist die Installation des von Datadog bereitgestellten Agenten wesentlich reibungsloser als die des Loki-Agenten von Grafana. Dies ist der erste Schritt bei der Einrichtung Ihres Datadog-Kontos. Wenn Sie ein neues Datadog-Konto erstellen, werden Sie als Erstes aufgefordert, den Datadog-Agenten auf einem Computer zu installieren, den Sie überwachen möchten.

Serverprotokollierung

Sobald Sie den Datadog-Agenten installiert haben, können Sie bereits mit der Überwachung Ihrer Instanz beginnen. Datadog verfügt über mehrere vorkonfigurierte Diagramme mit den relevanten Metriken und Statistiken von jedem verbundenen Host. Diese sind sichtbar, sobald diese Hosts mit der Rückmeldung beginnen, ohne dass Sie etwas konfigurieren müssen. Die Plattform erkennt dabei automatisch Standarddienste und erstellt automatisch Visualisierungen für Logs, Metriken und Traces.

Wenn Sie viele Ressourcen konfigurieren müssen oder nicht die Zeit haben, die relevanten Datenpunkte auf einem Dashboard einzurichten, ist dies eine einfachere Option als die arbeitsintensive Einrichtung von Grafana-Dashboards.

Dashboard von Datadog
Abbildung 4: Das ist das Dashboard von Datadog.

AWS

Wenn Sie die Integration von Datadog mit Amazon CloudWatch einrichten, werden automatisch mehrere verschiedene Dashboards für Sie erstellt. Je nachdem, welche Arten von Metriken Sie über Ihr Konto erfassen möchten, können die Standardeinstellungen für Sie nützlich sein.

Der in der Grafik gezeigte Beispiel-Bucket dient der Sicherung und Archivierung und muss nicht ständig überwacht werden. Datadog kann nicht erkennen, welchem Zweck die einzelnen Teile Ihrer Infrastruktur dienen, erstellt jedoch Diagramme für jeden Dienst.

Sicherung und Archivierung
Abbildung 5: Dieser Bucket ist ein Beispiel und dient der Sicherung und Archivierung.

Dashboards

Datadog leistet viel Arbeit, um die Dashboards für jede Integration vorzukonfigurieren, sodass die Einrichtungszeit für neue Konten und Plug-ins minimal ist. Das bedeutet jedoch nicht, dass Sie mit den bereitgestellten Diagrammen vorliebnehmen müssen, wenn diese Ihren Anforderungen nicht entsprechen. Sie können jedes Diagramm kopieren und anpassen.

Sobald Sie jedes Dashboard nach Ihren Wünschen konfiguriert haben, können Sie es als JSON exportieren, um es zu versionieren oder zu sichern. Damit ist es genauso flexibel wie die Dashboard-Angebote von Grafana. Zudem können Sie Dashboards heute mit KI-generierten Empfehlungen automatisch erweitern oder neue Visualisierungen auf Basis von Nutzungsdaten vorschlagen lassen.

Anpassung der Dashboards
Abbildung 6: Sie können die Dashboards nach Ihren Vorlieben anpassen.

Preise

Als neuer Benutzer braucht man etwas Zeit, um die Preisstruktur von Datadog zu verstehen. Für jede Art von überwachten Diensten gibt es unterschiedliche Preisstufen mit unterschiedlichen Funktionen. Je nachdem, wie viele Dienste Sie integrieren müssen und wie viele Ressourcen Sie überwachen möchten, können die Kosten schnell steigen.

So zahlen Sie für das Product Custom Metrics beispielsweise pro 100 benutzerdefinierter Metriken pro Monat etwa 4,30 Euro (fünf US-Dollar). Dabei spielt es keine Rolle, ob jährlich, monatlich oder On-Demand abgerechnet wird. Bei anderen Produkten gibt es dabei durchaus Unterschiede.

Bevor Sie sich anmelden, sollten Sie auswählen, welche Ressourcen auf welcher Ebene überwacht werden sollen. Steigern Sie dann langsam die Anzahl, während Sie die monatlichen Kosten im Auge behalten. Andernfalls können die Kosten für die Nutzung von Datadog schnell in die Höhe schnellen, was es bei falscher Konfiguration weitaus teurer macht als alle Grafana-Stufen. Das Preismodell orientiert sich inzwischen stärker an Host Units, Log Events und einzelnen Funktionsmodulen, was eine genauere Kostensteuerung ermöglicht.

Datadog versus Grafana

Grafana und Datadog sind bekannte Tools für Monitoring und Observability, mit denen sich Logs, Metriken und Traces aus Cloud- und On-Premises-Umgebungen erfassen, analysieren und visualisieren lassen. Grafana punktet mit flexibler On-Premises- oder Hybrid-Nutzung, anpassbaren Dashboards und OpenTelemetry-Unterstützung. Datadog ist Cloud-basiert, bietet KI-gestützte Anomalieerkennung, vorkonfigurierte Dashboards und schnelle Einrichtung. Die Wahl hängt von Budget, Anforderungen und Infrastruktur ab.

Erfahren Sie mehr über Data-Center-Betrieb