Cloud-Datenbank
Was ist eine Cloud-Datenbank?
Eine Cloud-Datenbank ist eine organisierte und verwaltete Sammlung von Daten in einem IT-System, das sich auf einer Public-, Private- oder Hybrid-Cloud-Computing-Plattform befindet. Aus der Perspektive des Gesamtdesigns und der Funktionalität unterscheidet sich eine Cloud-Datenbank nicht von einer lokalen Datenbank, die auf den eigenen Rechenzentrumssystemen einer Organisation ausgeführt wird. Der größte Unterschied zwischen ihnen liegt in der Art und Weise, wie die Datenbank bereitgestellt und verwaltet wird.
Beispielsweise erscheint dieselbe Datenbank für Endbenutzer und Anwendungen identisch, unabhängig davon, ob sie sich vor Ort oder in der Cloud befindet. Je nach verwendeter Datenbanksoftware können Cloud-Datenbanken strukturierte, unstrukturierte oder halbstrukturierte Daten speichern, genau wie ihre Pendants in lokalen Umgebungen.
Die Nutzung einer Cloud-Datenbank verändert jedoch die Verantwortlichkeiten der IT- und Datenmanagement-Teams. Cloud-Anbieter installieren und verwalten die zugrunde liegende Systeminfrastruktur und in Managed-Services-Umgebungen die Datenbankplattform. Dadurch wird der routinemäßige Verwaltungsaufwand reduziert, der traditionell von IT-Mitarbeitern und Datenbankadministratoren (DBAs) geleistet wird. Ein DBA kann dann andere Aufgaben übernehmen, wie zum Beispiel die Optimierung von Datenbanken für Anwendungen und die Verfolgung der Nutzung und Kosten von Cloud-Datenbanksystemen.
Wie bei anderen IT-Systemen verlagert sich auch bei Datenbankimplementierungen der Schwerpunkt in Richtung Cloud. In einem im Dezember 2023 veröffentlichten Bericht gab Gartner an, dass Cloud-Datenbanken inzwischen mehr als die Hälfte der weltweiten Einnahmen aus Datenbankmanagementsystemen (DBMS) und fast das gesamte Umsatzwachstum auf dem Markt ausmachen. In einer Umfrage unter 753 Cloud-Nutzern, die Ende 2023 vom Anbieter von IT-Management-Tools Flexera durchgeführt wurde, gaben 65 Prozent an, dass ihre Unternehmen Data Warehouses in der Public Cloud nutzen, während 57 Prozent Cloud-basierte relationale Datenbankdienste eingeführt haben und 44 Prozent NoSQL-Dienste nutzen. All diese Zahlen sind im Vergleich zur vorherigen Ausgabe der jährlichen Umfrage deutlich gestiegen.
Funktionsweise von Cloud-Datenbanken
In Unternehmen werden Datenbanken verwendet, um Daten zu sammeln, zu organisieren und an Führungskräfte und Mitarbeiter für Betriebs- und Analyseanwendungen weiterzugeben. Im Allgemeinen bieten Cloud-Datenbanken die gleichen Datenverarbeitungs-, Verwaltungs- und Zugriffsfunktionen wie lokale Datenbanken. Bestehende lokale Datenbanken können in der Regel zusammen mit den von ihnen unterstützten Anwendungen in die Cloud migriert werden.
Anstelle herkömmlicher Softwarelizenzen basiert die Preisgestaltung auf der Nutzung von Systemressourcen, die bei Bedarf bereitgestellt werden können, um die Verarbeitungslast zu bewältigen. Alternativ können Benutzer Datenbankinstanzen reservieren – in der Regel für mindestens ein Jahr -, um bei regelmäßige Arbeitslasten mit gleichbleibenden Kapazitätsanforderungen einen Preisnachlass zu erhalten.
Organisationen, die Datenbanken in der Public Cloud implementieren, können zwischen den folgenden beiden Bereitstellungsmodellen wählen:
1. selbstverwaltete Datenbank: Hierbei handelt es sich um eine IaaS-Umgebung (Infrastructure as a Service), in der die Datenbank in einer virtuellen Maschine auf einem System ausgeführt wird, das ein Cloud-Anbieter betreibt. Der Anbieter verwaltet und unterstützt die Cloud-Infrastruktur, einschließlich Servern, Betriebssystemen und Speichergeräten. Anwender sind jedoch für die Bereitstellung, Verwaltung und Wartung der Datenbank selbst verantwortlich. Für den Datenbankadministrator ähnelt dies einer lokalen Bereitstellung , da er die vollständige Kontrolle über die Datenbank behält.
2. verwalteter Datenbankdienst: Database-as-a-Service-Umgebungen (DBaaS) werden vollständig vom Anbieter verwaltet, bei dem es sich um einen Cloud-Plattformanbieter oder einen anderen Datenbankanbieter handeln kann, der sein Cloud-DBMS auf der Infrastruktur eines Plattformanbieters ausführt. Beim DBaaS-Modell werden sowohl die Systeminfrastruktur als auch die Datenbankplattform für den Kunden verwaltet. Der DBaaS-Anbieter kümmert sich um Bereitstellung, Backups, Skalierung, Patching, Upgrades und andere grundlegende Datenbankverwaltungsfunktionen, während der Datenbankadministrator die Datenbank überwacht und sich bei einigen Verwaltungsaufgaben mit dem Anbieter abstimmt. Ähnliche Angebote für Data Warehouse as a Service (DWaaS) sind auch für die Bereitstellung von Cloud Data Warehouses verfügbar.
Darüber hinaus bieten einige Cloud-Anbieter – beispielsweise Amazon Web Services (AWS) und Oracle – Versionen ihrer DBaaS-Technologien zur Installation in lokalen Rechenzentren als Teil einer Private Cloud oder einer Hybrid-Cloud-Infrastruktur an, die Public und Private Clouds kombiniert. Wie bei einer regulären DBaaS-Umgebung stellt der Anbieter die Datenbanken auf seinen eigenen Systemen bereit und verwaltet sie für die Kunden. Er liefert die Systeme jedoch an das Rechenzentrum eines Kunden, damit sie dort ausgeführt werden, und verwaltet die Datenbanken dann aus der Ferne.
Viele Anbieter bieten inzwischen auch serverlose Datenbanken in der Cloud an. Wie DBaaS handelt es sich dabei um verwaltete Dienste, und die beiden Begriffe werden manchmal synonym verwendet. Es gibt jedoch einige Unterschiede. Serverlose Systeme erstellen beispielsweise automatisch die von Datenbankanwendungen benötigten Verarbeitungsressourcen und werden bei schwankender Arbeitslast nach oben oder unten skaliert, während DBaaS in der Regel eine bestimmte Menge an Ressourcen mit Skalierungsoptionen umfasst. Der Begriff serverless ist eigentlich irreführend – die Datenbanken laufen auf den Servern eines Cloud-Anbieters. Aus Kundensicht sind sie jedoch effektiv serverlos.

Arten von Cloud-Datenbanken
Es gibt eine Vielzahl von Cloud-Datenbanken, die zu den verschiedenen Arten von Datenbanktechnologien passen, die On-Premises eingesetzt werden können. Mittlerweile bietet jeder namhafte Datenbankanbieter seine Software in der Cloud an. Dazu gehören Cloud-native Datenbanken, die speziell für den Einsatz in Cloud-Umgebungen entwickelt wurden, und bestehende lokale Datenbanken, die jetzt die Cloud unterstützen.
Im Folgenden werden die wichtigsten Arten von Datenbanken vorgestellt, die Cloud-Nutzern zur Verfügung stehen:
- relationale Datenbanken: Relationale Software, auf die mit der SQL-Programmiersprache zugegriffen und die mit dieser verwaltet wird, dominiert seit den 1990er Jahren den Datenbankmarkt und ist nach wie vor die am weitesten verbreitete DBMS-Technologie. Sie eignet sich besonders gut für die Transaktionsverarbeitung und andere Anwendungen mit strukturierten Daten, da das relationale Modell die Datenintegrität und -konsistenz unterstützt. Relationale Datenbanken organisieren Daten in Tabellen mit Zeilen und Spalten und verwenden ein festes Schema, um Konsistenzregeln durchzusetzen.
- NoSQL-Datenbanken: NoSQL-Systeme verzichten auf die starren Schemata relationaler Datenbanken und sind daher eine bessere Option für semistrukturierte und unstrukturierte Daten wie Text, Protokolldateien, Sensordaten und Videos. Trotz des Begriffs bieten viele von ihnen einige SQL-Funktionen und können auch zum Speichern großer Mengen strukturierter Daten verwendet werden, insbesondere für Anwendungen, die keine vollständige Konsistenz erfordern. Aus diesem Grund bedeutet NoSQL heute eher not only SQL. Es gibt vier große SQL-Produktkategorien: Dokumentendatenbanken, Schlüssel-Werte-Datenbanken, Wide Column Stores und Graphdatenbanken.
- multimodale Datenbanken: Diese Datenbanken unterstützen mehr als ein Datenmodell, sodass sie eine größere Anzahl von Anwendungen ausführen können. Viele relationale und NoSQL-Datenbanken sind jetzt durch Add-ons multimodal, zum Beispiel durch das Hinzufügen eines Graphmoduls zu einem relationalen DBMS oder einer NoSQL-Dokumentendatenbank.
- verteilte SQL-Datenbanken: Diese Technologien, die ursprünglich als NewSQL-Datenbanken bezeichnet wurden und in einigen Fällen immer noch so genannt werden, verteilen relationale Datenbanken auf mehrere Rechenknoten, um Transaktionssysteme zu erstellen, die eine NoSQL-ähnliche Skalierbarkeit bieten können.
- Cloud Data Warehouses: Ursprünglich entwickelt, um Data-Warehouse-Funktionen für Business-Intelligence- und Reporting-Anwendungen bereitzustellen, unterstützen Cloud Data Warehouse- und DWaaS-Technologien heute in der Regel auch die Entwicklung von Data Lakes, die große Mengen an Rohdaten enthalten, sowie maschinelles Lernen und andere fortgeschrittene Analysefunktionen.
Für bestimmte Anwendungen stehen auch spezialisierte Datenbanken zur Verfügung. Dazu gehören vor allem Zeitreihendatenbanken, die zeitgestempelte Daten in sequenzieller Reihenfolge speichern, Vektordatenbanken, die für die Unterstützung groß angelegter Ähnlichkeitssuchen in unstrukturierten Datensätzen ausgelegt sind, konventionellere Datenbanksuchmaschinen und Ledger-Datenbanken, die mithilfe von Blockchain- und anderen kryptografischen Verfahren eine unveränderliche Aufzeichnung von Transaktionen erstellen.
Schlüsselkomponenten von Cloud-Datenbankmanagementsystemen
Wie andere Arten von DBMS-Technologien umfassen Cloud-Datenbankplattformen eine Reihe von Komponenten, die zusammenarbeiten, um Daten zu verarbeiten und zu verwalten. Die Liste der Schlüsselkomponenten umfasst folgende Elemente:
- eine Storage-Engine, die die Datenspeicherung verwaltet
- ein Metadatenkatalog, der Daten über Datenbankobjekte enthält
- eine Datenbankzugriffssprache, wie zum Beispiel SQL, zum Abfragen und Ändern von Daten
- ein Abfrageoptimierer und ein separater Abfrageprozessor
- ein Lock-Manager zur Steuerung des gleichzeitigen Zugriffs auf Daten
- ein Protokollmanager zur Aufzeichnung von Änderungen an den Daten
- eine Reihe von Datenbankverwaltungsprogrammen
Vorteile von Cloud-Datenbanken
Im Vergleich zu lokal ausgeführten Datenbanken bieten Cloud-Datenbanken Anwenderunternehmen folgende potenzielle IT- und Geschäftsvorteile:
- erhöhte Skalierbarkeit und Flexibilität: Cloud-Datenbanksysteme können bei steigender Arbeitslast einfach durch Hinzufügen von mehr Verarbeitungs- und Storage-Kapazität erweitert werden. Einige Anbieter bieten Funktionen zur automatischen Skalierung an, die das dynamisch tun, ohne dass Benutzer überhaupt eine Anfrage stellen müssen – eine Funktion, die besonders bei serverlosen Datenbanken weit verbreitet ist. Darüber hinaus kann eine Organisation schnell neue Datenbanken bereitstellen und nicht mehr benötigte Datenbanken abschalten, wodurch die Datenbankstrategie an die Geschwindigkeit des Unternehmens angepasst wird.

- Wegfall der IT-Infrastruktur: Da der Cloud-Anbieter für die Systeminfrastruktur in einer Cloud-Datenbankumgebung verantwortlich ist, kann eine Organisation möglicherweise ihren eigenen IT-Fußabdruck durch die Stilllegung von Systemen reduzieren, insbesondere wenn sie lokale Datenbanken in die Cloud verlagert. Zumindest kann sie vermeiden, dass bei der Bereitstellung neuer Datenbanken weitere Systeme hinzugefügt werden müssen.
- schnellerer Zugriff auf neue Funktionen: Bei lokalen Datenbanken müssen Benutzer auf ein Software-Upgrade warten und dieses dann installieren, um neue Funktionen zu erhalten. Anbieter von DBaaS und serverlosen Datenbanken können Cloud-Datenbanken fortlaufend aktualisieren, sodass Unternehmen neue Funktionen nutzen können, sobald sie verfügbar sind.
- zuverlässigere Systeme mit garantierter Betriebszeit: Cloud-Anbieter offerieren Hochverfügbarkeit, automatisierte Sicherungs- und Disaster-Recovery-Funktionen, die oft fortschrittlicher sind als das, was die Nutzerorganisationen implementiert haben. Die Anbieter garantieren auch prozentuale Betriebszeiten als Teil ihrer Cloud-Service-Level-Agreements (SLA) mit den Kunden, was ihnen einen Anreiz bietet, dafür zu sorgen, dass die Cloud-Datenbankplattformen reibungslos funktionieren.
- Kosteneinsparungen: Geringere Investitionsausgaben, Betriebskosten für Rechenzentren und Platzbedarf in IT-Einrichtungen sowie mögliche Einsparungen beim IT-Personal können insgesamt zu niedrigeren Ausgaben führen. Aber das ist nicht sicher: Cloud-Dienste mit nutzungsabhängiger Bezahlung können mehr kosten als geplant, wenn die Ressourcennutzung die Erwartungen übersteigt oder umgekehrt, wenn überschüssige Kapazitäten unbemerkt bleiben. Eine Cloud-Datenbankumgebung muss genau überwacht werden, um die Cloud-Kosten unter Kontrolle zu halten.
Andererseits können lokale Datenbanken für einige Organisationen immer noch die beste Option sein, insbesondere wenn sie die volle Kontrolle über die Datenbankumgebung behalten wollen oder es aus Compliance- oder regulatorischen Gründen erforderlich ist. Weitere Faktoren, die bei der Entscheidung zwischen Cloud- und lokalen Datenbanken zu berücksichtigen sind, sind die Datenmenge, die in ein Cloud-System übertragen und aus diesem heraus übertragen werden soll, und die Wahl der Tools für die Datenbankverwaltung und Leistungsüberwachung.
Migration von Datenbanken in die Cloud
Wie bereits erwähnt, kann die Migration von lokalen Datenbanken in eine Cloud-Umgebung es einer Organisation ermöglichen, interne IT-Systeme außer Betrieb zu nehmen und die Vorteile von Cloud-Datenbanken auszukosten. Die Verlagerung einer Datenbank in die Cloud kann auch eine Möglichkeit sein, die Effizienz der Datenverarbeitung und die Anwendungsleistung im Rahmen einer umfassenderen Cloud-Bereitstellung zu steigern.
Die Datenbankmigration kann jedoch ein komplexer Prozess sein. Bevor sie beginnen, müssen Organisationen verschiedene Faktoren berücksichtigen und eine Datenbankmigrationsstrategie planen. Eine grundlegende Entscheidung ist beispielsweise, ob die Migration zu einer selbstverwalteten IaaS-Umgebung oder einer anbieterverwalteten DBaaS-Umgebung erfolgen soll. Eine weitere Entscheidung ist, ob die Migration zur Cloud-Version des aktuellen DBMS oder zu einer anderen Datenbanktechnologie erfolgen soll. Der Wechsel von Datenbanken kann finanzielle oder funktionale Vorteile haben, aber auch Kompatibilitätsprobleme verursachen.
Selbst einige verwandte lokale und Cloud-Datenbanktechnologien stimmen in ihren Funktionen nicht vollständig überein. So nutzt beispielsweise der relationale Cloud-Dienst Azure SQL Database von Microsoft eine gemeinsame Codebasis mit der lokalen SQL-Server-Datenbank, aber es gibt Unterschiede zwischen den beiden Produkten, die eine Umstrukturierung der SQL-Serverdatenbanken erfordern können, bevor sie zu Azure SQL Database migriert werden können. Azure SQL Managed Instance, eine Version der Cloud-Software, die Microsoft entwickelt hat, um die Datenbankmigration zu erleichtern, ist immer noch nicht zu 100 Prozent kompatibel mit SQL Server.
Anbieterlandschaft für Cloud-DBMS
Es überrascht nicht, dass die führenden Cloud-Plattformanbieter – AWS, Google Cloud Platform, Microsoft und Oracle – laut Gartner auch die führenden Datenbankanbieter in der Cloud sind. Sie alle unterstützen sowohl IaaS- als auch DBaaS-Umgebungen auf ihren Plattformen und bieten verschiedene Arten von Cloud-Datenbanken an, darunter relationale, NoSQL-, Data-Warehouse- und Spezialdatenbanken. Jeder stellt Anwendern mehr als zehn separate Datenbankdienste zur Verfügung.
Im Folgenden finden Sie einige weitere prominente Anbieter von Cloud-Datenbanken, basierend auf Anbieter-Rankings von Beratungsunternehmen wie Gartner und Forrester Research, DBMS-Popularitäts-Rankings auf der DB-Engines-Website:
- IBM und SAP, zwei weitere große IT-Anbieter, haben sich von On-Premises-Datenbanken abgewandt und bieten nun eine breite Palette von Cloud-DBMS-Diensten an.
- NoSQL-Datenbankanbieter sind unter anderem Couchbase, DataStax, MongoDB, Neo4j und Redis.
- Anbieter für Cloud Data Warehouses sind Snowflake und Yellowbrick Data.
- Anbieter von Analysedatenbanken wie Cloudera, Databricks und Teradata unterstützen Data Warehouses, Data Lakes und Data Lakehouses, die Aspekte der beiden anderen Technologien kombinieren.
- InterSystems und Progress Software sind Anbieter von Multi-Modell-Datenbanken, die 2023 das ehemalige MarkLogic übernommen haben.
- Cockroach Labs und Yugabyte bieten verteilte SQL-Datenbanken an.
- Elastic ist ein Anbieter für Datenbanksuchmaschinen.
- Alibaba Cloud und Tencent Cloud, zwei Anbieter von Cloud-Plattformen, sind hauptsächlich in China tätig und verfügen über umfangreiche Datenbankportfolios.
Optionen für Open-Source-Datenbanken
Unternehmen können auch verschiedene Open-Source-Datenbanken in der Cloud nutzen. Wie andere Open-Source-Software werden auch diese Datenbanken in einem gemeinschaftlichen Prozess entwickelt, und ihr Quellcode ist offen zugänglich, auch wenn in vielen Fällen die Datenbankanbieter die Entwicklungsarbeit leiten. Zu den beliebten relationalen Open-Source-Datenbanken gehören MySQL, PostgreSQL, MariaDB, Firebird und SQLite. Viele NoSQL-Datenbanken sind ebenfalls unter Open-Source-Lizenzen verfügbar.
Bei der Abwägung zwischen Open-Source- und proprietären Datenbanken sind unter anderem die Kosten, der Bedarf an technischem Support und die Anforderungen an bestimmte Merkmale und Funktionen zu berücksichtigen. Open-Source-Datenbanken können Unternehmen auch dabei unterstützen, die Bindung an einen bestimmten Anbieter zu vermeiden, da sie von mehreren Anbietern erhältlich sind. Darüber hinaus ist die Kompatibilität mit Technologien wie MySQL und PostgreSQL in einige proprietäre Datenbanken integriert – Amazon Aurora von AWS und AlloyDB für PostgreSQL von Google sind zwei Beispiele hierfür. Infolgedessen können Benutzer oft von einem Datenbankdienst zu einem anderen kompatiblen Dienst wechseln.
Die Kategorien Open Source und Proprietär schließen sich jedoch nicht gegenseitig aus. Während die Community-Editionen von Open-Source-Datenbanken kostenlos bereitgestellt werden können, bieten die Anbieter in der Regel kommerziellen Support oder Versionen mit proprietären Funktionen an. Oracle ist beispielsweise Eigentümer von MySQL und vertreibt mehrere Editionen der Datenbank, die auch von AWS, Google, Microsoft und vielen anderen Anbietern kommerziell angeboten wird. Auch PostgreSQL und MariaDB sind von verschiedenen Anbietern erhältlich, darunter EDB, das sich auf PostgreSQL konzentriert und MariaDB PLC, das die Entwicklung dieser Datenbank leitet.
Einige Anbieter, die Open-Source-Datenbanken entwickelt haben, sind inzwischen zu Softwarelizenzen übergegangen, die nicht vollständig quelloffen sind. Solche Lizenzen, die oft als quellverfügbare Lizenzen (source available) bezeichnet werden, stehen im Einklang mit den meisten Open-Source-Grundsätzen. Sie verlangen jedoch, dass andere Cloud-Anbieter, die DBaaS-Implementierungen einer Datenbank anbieten möchten, eine kommerzielle Lizenz erwerben oder den geänderten und zugehörigen Quellcode öffentlich zugänglich machen, damit andere ihn nutzen können. Zu den Anbietern, die diese Art von Lizenzen verwenden, gehören Couchbase, MongoDB, Redis, Cockroach Labs und Elastic.
Worauf ist bei der Auswahl einer Cloud-Datenbank zu achten?
Die Datenbank ist eine der wichtigsten Technologien in jeder IT-Umgebung. Im Folgenden sind einige der Funktionen und Aspekte aufgeführt, die Unternehmen bei der Bewertung von Cloud-Datenbanken für geplante Implementierungen berücksichtigen sollten:
- Leistung: Wie bei jeder Art von IT-System ist das wahrscheinlich der wichtigste Faktor, den es zu berücksichtigen gilt, insbesondere wenn die Datenbank hochleistungsfähige Arbeitsleisten unterstützen soll. Die Skalierbarkeit ist dabei ein entscheidender Faktor – zum Beispiel, um sicherzustellen, dass Echtzeitverarbeitungsaufträge nicht ins Stocken geraten. Leistungsüberwachungs- und Optimierungsfunktionen sind ein weiterer wichtiger Aspekt, den es zu berücksichtigen gilt.
- Kosten: Die großen Cloud-Anbieter bieten kostenlose Online-Kostenrechner an, mit denen verschiedene Szenarien für Preismodelle, Servicekonfigurationen, Verarbeitungsregionen und andere Parameter geprüft werden können, um den erwarteten Ressourcenbedarf und das verfügbare Budget in Einklang zu bringen.
- Verfügbarkeit: Hochverfügbarkeit, Disaster Recovery und Data-Backup- und Recovery-Funktionen sollten ebenso geprüft werden wie die SLA des Cloud-Anbieters für die Betriebszeit.
- Sicherheit: Die Sicherung einer DBaaS-Umgebung liegt nicht allein in der Verantwortung des Anbieters, aber es ist von entscheidender Bedeutung zu wissen, was er handhaben wird und welche Sicherheits-Tools und -Maßnahmen er anwenden wird.
Überlegungen zur Architektur von Cloud-Datenbanken
Der einfachste Ansatz für die Bereitstellung von Cloud-Datenbanken ist die Verwendung einer einzigen Public-Cloud-Plattform. Das gewährleistet die Konsistenz der zugrunde liegenden Cloud-Infrastruktur und die Zusammenarbeit mit einem einzigen Cloud-Anbieter, selbst wenn mehrere DBaaS-Anbieter beteiligt sind. Das ist jedoch nicht immer praktikabel und entspricht nicht immer den IT- und Geschäftsanforderungen eines Unternehmens. Infolgedessen müssen IT- und Datenmanagementteams möglicherweise die folgenden Architekturstrategien in Betracht ziehen.
Hybride Cloud-Architektur
Eine Option ist die Bereitstellung von Datenbanken in einer Hybrid Cloud, das heißt einige davon in einer Public Cloud und andere in einer Private Cloud, die in einem Rechenzentrum On-Premises eingerichtet ist. Alexander Wurm, Senior Analyst beim Beratungsunternehmen Nucleus Research, sagt, dass die Verwendung einer Hybrid Cloud es Unternehmen ermöglicht, „die Vorteile der modernen Cloud, wie regelmäßige Updates und elastische Skalierbarkeit, zu nutzen, ohne die Sicherheit und Zuverlässigkeit der bestehenden lokalen Infrastruktur zur Unterstützung geschäftskritischer Arbeitslasten zu beeinträchtigen.“
Bei der Planung einer hybriden Cloud-Datenbankstrategie sind unter anderem folgende Punkte zu berücksichtigen:
- Anforderungen an die Datenmigration
- Datensicherheit
- Konsistenz und Kompatibilität zwischen Cloud- und On-Premises-Plattformen
- potenzielle Datenlatenzprobleme
- Gruppierung von Anwendungen und Datenbanken in logischen Einheiten, um den Bereitstellungsprozess besser verwalten zu können
Multi-Cloud-Architektur
Eine Multi-Cloud-Datenbankarchitektur umfasst die Nutzung mehrere Public-Cloud-Plattformen. Sie kann dazu beitragen, die Bindung an einen Cloud-Anbieter zu vermeiden, und ermöglicht es Unternehmen, verschiedene Datenbanken und Anwendungen auf der Cloud-Plattform bereitzustellen, die am besten zu ihnen passt. Eine Multi-Cloud-Strategie kann auch in eine Hybrid-Cloud-Umgebung integriert werden, um einen noch umfassenderen Ansatz für die Datenbankbereitstellung zu erhalten.
Unternehmen, die die Vorteile von mehr als einer Public Cloud nutzen möchten, sollten folgende Best Practices für das Multi-Cloud-Datenbankmanagement kennen:
- Beginnen Sie mit einem umfassenden Plan und einem Governance-Framework.
- Betreiben Sie die richtige Datenbank in der richtigen Cloud.
- Verwenden Sie Datendienste, die Multi-Cloud-Umgebungen unterstützen.
- Nutzen Sie verwaltete Datenbankdienste oder DBaaS.
- Berücksichtigen Sie die Portabilität von Datenbanken über mehrere Clouds hinweg.
- Reduzieren Sie die Anzahl der verschiedenen Datenbanken.
- Reduzieren Sie die Anzahl der gleichen Datenbanken.
- Optimieren Sie den Datenzugriff für Anwendungen und Endanwender.
- Behalten Sie Daten nach Möglichkeit lokal in einer Cloud-Plattform.
- Verbinden Sie Cloud-Netzwerke, um die Datenlatenz zu verringern.

Sicherheit von Cloud-Datenbanken
Wie bereits erwähnt, ist die Sicherheit von Cloud-Datenbanken nicht allein Sache des Anbieters. Was er abdeckt, kann von Anbieter zu Anbieter variieren. Im Rahmen des Prinzips der geteilten Verantwortung für die Cloud-Sicherheit müssen die Benutzer jedoch die Datenbanksicherheit in IaaS-Umgebungen, in denen sie das DBMS selbst bereitstellen und verwalten, vollständig übernehmen. DBaaS-Anbieter übernehmen mehr Verantwortung für die Sicherung der Datenbankplattform, aber DBAs oder Sicherheitsteams in Unternehmen sind in der Regel weiterhin für Dinge wie Identitäts- und Zugriffsmanagement, Endpunktsicherheit, Anwendungssicherheit und einige Aspekte der Datensicherheit zuständig.
Im Folgenden werden einige der häufigsten Herausforderungen bei der Sichtung von Cloud-Datenbanken genannt:
- Konfiguration und Wartung von Zugriffskontrollen
- Verwaltung der Datenbankverschlüsselung
- Durchsetzung von Benutzerprivilegien und Berechtigungen
Zur Vermeidung von Datenschutzverletzungen und -gefährdungen umfassen die bewährten Praktiken für die Datenbanksicherheit in Benutzerorganisationen unter anderem die Änderung von Standardanmeldungen und Benutzeranmeldeinformationen, die Verwendung selbstverwalteter kryptografischer Schlüssel und die Aktivierung vollständiger Sicherheitsprotokollierungsfunktionen.

Rollen und Verantwortlichkeiten beim Cloud-Datenbankmanagement
Auch in einer DBaaS- oder DWaaS-Umgebung spielen DBAs die Hauptrolle bei der Verwaltung der Cloud-Datenbanken eines Unternehmens. Der Unterschied besteht darin, dass der Cloud-Anbieter den Großteil der regelmäßigen, laufenden Verwaltung einer Datenbankplattform übernimmt. Anstatt diese grundlegenden Aufgaben direkt zu erledigen, kann der DBA bei Bedarf eingreifen, zum Beispiel bei der Anpassung von Datensicherungs- oder Systemwartungsplänen aufgrund von Anwendungsanforderungen.
Cloud-Datenbanken bringen auch einige neue Aufgaben für den DBA mit sich. Insbesondere die Überwachung der Nutzung und der Kosten von Cloud-Datenbanksystemen ist eine wichtige Aufgabe für einen DBA. Das hilft Unternehmen, Budgetüberschreitungen zu vermeiden und erforderliche Änderungen an Konfigurationen oder ausgewählten Leistungsstufen zu erkennen.

Trends bei Cloud-Datenbanken
Im Folgenden werden einige aktuelle und sich abzeichnende Trends im Zusammenhang mit Cloud-Datenbanken beschrieben:
- Die Marktdominanz von relationaler Software nimmt ab, da Benutzer – und Anbieter – Alternativen einsetzen: Relationale Datenbanken sind zwar immer noch die mit Abstand am meisten genutzte DBMS-Technologie, aber andere Typen werden zunehmend von Anwendern eingesetzt und in die Produktportfolios der Anbieter aufgenommen, schreiben die unabhängigen Analysten Merv Adrian und Sanjeev Mohan in einem Blogbeitrag vom Februar 2024. Relationale Software machte einst mehr als 90 Prozent des weltweiten DBMS-Umsatzes aus, aber ihr Marktanteil ist laut Gartner auf unter 80 Prozent gesunken. Zum Teil als Reaktion auf diesen Rückgang bauen die Anbieter relationaler DBMS mehr nicht-relationale Funktionen in ihre Produkte ein. Gartner prognostiziert, dass relationale Systeme bis 2027 80 Prozent der praktischen Funktionalität von NoSQL-Datenbanken enthalten werden, gegenüber 60 Prozent im Jahr 2022.
- Das Interesse an Vektordatenbanken zur Unterstützung der generativen KI-Entwicklung steigt: Eine der nicht-relationalen Technologien, die eine breitere Akzeptanz erfährt, ist Vektordatenbanksoftware. Vektordatenbanken bieten numerische Darstellungen von unstrukturierten Daten in einem mehrdimensionalen Raum, um Benutzern das Auffinden ähnlicher Daten zu erleichtern, zum Beispiel in großen Mengen von Text. Seit Anfang der 2000er Jahre waren sie eine Nischentechnologie, doch mit dem Aufkommen der generativen KI hat sich ihre Nutzung erheblich erweitert. Vektordatenbanken eignen sich gut zum Speichern, Verwalten und Abrufen der Daten, die in den großen Sprachmodellen verwendet werden, die ChatGPT und anderen GenAI-Tools zugrunde liegen. Infolgedessen entstehen neue Anwendungsfälle für Vektordatenbanken in Bereichen wie Kunden-Support, Betrugserkennung und Verarbeitung natürlicher Sprache.
- GenAI-Funktionen werden zu anderen Datenbanktypen hinzugefügt: Zusätzlich zur Förderung von Vektordatenbanken für generative KI-Anwendungen fügen DBMS-Anbieter GenAI-Tools hinzu, die den Benutzern bei der Entwicklung und Verwaltung anderer Datenbanken helfen. Beispielsweise können GenAI-Assistenten zum Schreiben von Datenbankanwendungscode und zum Generieren von SQL-Abfragen verwendet werden.
- Cloud-Datenbanken werden in breitere Datenökosysteme eingebunden: Laut Gartner gehen Datenbankanbieter zunehmend dazu über, ihre Software enger mit anderen Datenverwaltungstechnologien zu integrieren. Gartner bezeichnet solche vereinheitlichten Frameworks als Datenökosysteme, während andere sie als moderne Datenstapel (modern data stack) bezeichnen. Ein Aspekt der laufenden Arbeit ist die Verknüpfung von Cloud-Datenbanken mit Data Fabrics, einer Architektur zur Automatisierung von Datenintegrationsprozessen und deren Wiederverwendbarkeit.