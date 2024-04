Das variable Kostenmodell ist die gängige Abrechnung in der Cloud: Je mehr Rechenleistung oder Speicher man nutzt, desto teurer wird es. Dies gilt auch für Cloud Data Warehouses, wobei die Preismodelle der einzelnen Anbieter wie zum Beispiel Snowflake, Google Big Query oder Microsoft Synapse variieren: von der zeitbasierten Abrechnung über On-Demand- oder Kapazitätspreise bis zu Pay-as-you-go-Modellen – es gibt etliche Varianten.

Welches Modell auch immer: Man möchte Verschwendung vermeiden und nicht für ungenutzte Kapazitäten zahlen. Um die Betriebskosten – die nur einen Teil der Gesamtbetriebskosten (TCO) eines Cloud Data Warehouses ausmachen – zu kontrollieren, bedarf es zunächst einer genauen Kenntnis der Kostenstruktur.

Das gilt für alle Beteiligten, von der Entwicklungsabteilung bis zu den Endanwendern. In der On-Premises-Welt hatten gewisse Tätigkeiten wie zum Beispiel Abfragen keine direkten Kostenkonsequenzen. Das ist in der Cloud anders. Jede Abfrage, jedes Laden oder Auffrischen von Daten kann Kosten generieren.

Designfehler durch Low-Code-Ansätze vermeiden

Der Einsatz einer geeigneten Entwicklungsplattform kann die Agilität steigern. Nur so lässt sich sicherstellen, dass Optimierungen zeitnah implementiert werden. Manch ein Designfehler kann teuer werden – insbesondere, wenn dadurch ein neues Laden großer Datenmengen erforderlich wird. Der Einsatz von Low-Code-Ansätzen unterstützt hier, Programmcode effizient zu gestalten und genau diese Fehler zu vermeiden.

Beim Laden von Daten und der effizienten Entwicklung von ELT-Strecken (Extract, Load, Transform) ist es ferner ratsam, kosteneffiziente Delta Loads anstatt von Full Loads zu verwenden. Dazu benötigt man allerdings auch die richtigen Werkzeuge, um dies effektiv zu implementieren.

„Die meisten Cloud-Data-Warehouse-Produkte sind heute einfach zu bedienen und bieten eine enorme Leistungsfähigkeit. Allerdings können die Kosten schnell aus dem Ruder laufen, da man für Speicher und Prozessierung zahlen muss.“ Christoph Papenfuss, Agile Data Engine

Moderne Cloud-Datenbanken bieten unterschiedliche Optimierungsmöglichkeiten, wie zum Beispiel Partitionierung und Clustering, an. Das Entwicklungsteam muss Einsicht in diese Möglichkeiten haben und auch in der Lage sein, sie effizient zu implementieren. Eine weitere Möglichkeit der Kostenkontrolle liegt in der Optimierung der Workflows. Auch hier sollte man darauf achten, dass die Data Engineers die Werkezeuge zur Hand haben, um Änderungen schnell und sicher vorzunehmen und ein unnötiges Datenprozessieren zu vermeiden. Generell gilt für die Entwicklung in Bezug auf Kosten: Je höher der Aufwand für Veränderungen ist, desto höher ist die Hürde, Optimierungen zu testen und durchzuführen. Agilität kann so helfen Kosten einzusparen.