Prostock-studio - stock.adobe.co

KI bringt Kapazitätsplanung mit Machine Learning voran

Mit geringeren Kosten und besserer Aufgabenoptimierung kann AIOps IT-Infrastrukturen revolutionieren. Erfahren Sie, wie dieser Ansatz sich mit Machine Learning umsetzen lässt.

Mit den Worten von Arthur C. Clarke: Jede ausreichend fortgeschrittene Technologie ist ununterscheidbar von Magie. Diese Aussage bestätigt sich in der IT-Branche laufend. Die Erfahrung lehrt, dass solche Technologien unweigerlich den Punkt erreichen, an dem sie von Menschen nur noch mit Automatisierung kontrollierbar sind.

Die zunehmenden Probleme mit VM-Sprawl waren das erste Anzeichen dafür, dass viele virtuelle Plattformen auf dem Weg sind, ins Chaos zu verfallen. Jüngst haben sich diese Probleme mit der Ressourcenverschwendung noch verschärft, da Cloud-Dienste weiterhin die konventionelle Unternehmensinfrastruktur verdrängen.

Das IT-Management hat sich von einfachen Portalen, die mehrere Systeme verbanden und verschiedene IT-Administrationsfunktionen an einem zentralen Ort verfügbar machten, zu komplexen Produkten mit ausgeklügelten Machine-Learning-Algorithmen entwickelt. Diese Algorithmen nutzen die enormen Mengen an Telemetriedaten, die moderne physische IT-Infrastrukturen und Cloud-Dienste generieren, um Informationen zum Verhalten einer gesamten Cloud-Umgebung zu filtern, korrelieren, zusammenzufassen, zu analysieren und letztendlich vorherzusagen.

Lassen Sie uns untersuchen, welche Funktionen in einem echten AIOps-Tool benötigt werden, und unter diesem Gesichtspunkt die Rolle der Künstlichen Intelligenz (KI) bei der Kapazitätsplanung und dem Ressourcenmanagement untersuchen.

Kernfunktionen von AIOps

Künstliche Intelligenz hat für verschiedene Personengruppen über Jahrzehnte hinweg viele verschiedene Dinge bedeutet. AIOps, eine Abkürzung für AI for IT Operations (KI für IT-Administratoren), ist ein Gartner-Schlagwort, das sich aus seinem ursprünglichen Begriff, algorithmic IT Operations (algorithmisch gestützter IT-Betrieb) entwickelt hat. Der ältere Begriff ist näher an der Realität dessen, was AIOps-Produkte tatsächlich tun.

Die meisten der versprochenen Funktionen von KI sind kaum mehr als die Anwendung von Operations Research (OR) auf die Administation. OR zerlegt Aufgaben in ihre Grundkomponenten und verwendet mathematische Analysen – zum Beispiel Algorithmen, maschinelles Lernen und Graphanalyse – um Schritte im Workflow und deren Reihenfolge festzulegen. KI führt denselben Prozess mit fortschrittlicher Automatisierung durch.

Angesichts einer Vielfalt an Funktionen und potenzieller Anwendungsfälle kann AIOps nicht als Plattform oder Produkttyp betrachtet werden – es ist eine Funktion, die in eine Vielzahl von IT-Arbeitsbereichen und Prozessen passt.

Produkte mit AIOps-Funktionen weisen sechs typische Fähigkeiten auf:

  • Aufnehmen von großen Datenmengen aus mehreren Quellen in Echtzeit, durch das Unterstützten verschiedener Datenübertragungsprotokolle und System-APIs,
  • Unterstützung für mehrere Datentypen, einschließlich System- und Anwendungstelemetrie, Protokolle und Konfigurationsdateien,
  • Verwenden einer Vielzahl von Statistik-, Simulations- und Optimierungsalgorithmen, wie zum Beispiel lineare Programmierung und Modellierung des maschinellen Lernens, um Daten zu analysieren,
  • die Fähigkeit, statistische und maschinelle Lernmodelle basierend auf Datenfeedback selbst zu korrigieren und zu optimieren,
  • APIs für Aufgabenautomatisierung über Batch-Operationen oder Workflows, die durch Ereignisse, Messungen oder Modellvorhersagen ausgelöst werden,
  • und eine grafische Managementnenutzeroberfläche (Graphic User Interface, GUI) mit Datenvisualisierung und -zusammenfassung – das heißt benutzerdefinierbare Dashboards.

In Kombination unterstützen diese Funktionen den IT-Betrieb und die DevOps-Teams bei mehreren Aufgaben, darunter:

  • Das KI-Tool identifiziert Basisnormen für die System- und Anwendungsleistung. Dies bietet eine frühzeitige Warnung vor Anomalien, die auf systemische Probleme, Sicherheitsvorfälle oder Änderungen zweiter Ordnung (Beschleunigung/Verzögerung) in Nutzungstrends hinweisen.
  • Es kann zukünftige Kapazitätsanforderungen basierend auf einer Kombination aus der historischen Nachfrage der Basis-Workloads sowie zurückliegende außergewöhnliche Belastungen vorhersagen.
  • KI errechnet Wahrscheinlichkeiten basierend auf historischen und aktuellen Daten, um bei der forensischen Vorfall- und Ursachenanalyse zu helfen.
  • Das System ersetzt manuelle Routineaufgaben durch automatisierte, datengesteuerte Workflows.

KI in der Kapazitätsplanung und im Ressourcenmanagement anwenden

Zwei der wertvollsten Anwendungen von KI sind die Kapazitätsplanung und das Ressourcenmanagement – insbesondere für Virtuelle Maschinen, Cloud-Instanzen und Containerknoten.

Die algorithmische Analyse ist für Betreiber von Cloud-Umgebungen aus zwei Gründen wertvoll.

Erstens trägt es zur Verbreitung der Cloud-Nutzung bei, wenn Ressourcen sich relativ einfach bereitstellen, verschieben und skalieren lassen. Menschliche Trägheit und Vergesslichkeit – und überarbeitetes Personal – führen oft zu verlassenen Instanzen, die Ressourcen verbrauchen und Kosten anhäufen. Durch die Kombination entstehen Cloud-Ressourcen, die über manuelle Prozesse schwer nachzuverfolgen und zu kontrollieren sind.

Zweitens ermöglichen die Tools die Optimierung von Elementen wie Recheninstanzen, Cloud-Objektspeichern und virtuelle Netzwerke basierend auf AIOps-Analysen. Mit Management-APIs können IT-Teams, Enterprise-VM-Umgebungen und Cloud-Instanzen programmgesteuert konfigurieren, klonen und außer Betrieb nehmen.

AIOps können einige der häufigsten Probleme von Cloud-Benutzern stark minimieren oder lösen. Benutzer können beispielsweise:

  • die beste Recheninstanz für eine bestimmte Anwendung auswählen, um Kosten und Leistung in Einklang zu bringen. In einer Ära zunehmend spezialisierter Hardware mit Instanzen, die auf Workloads spezifisch zugeschnitten sind – wie allgemeine, speicherintensive, GPU-beschleunigte (Graphics Processing Unit, Grafikprozessor) oder High Performance Computing Workloads – ist die Auswahl der besten Instanz für den Job ziemlich kompliziert. Und manuellen Methoden würden dafür regelmäßige Aktualisierungen von Tabellenkalkulationen des Instanztypen erfordern, um Änderungen oder Ergänzungen zu berücksichtigen.
  • proaktiv die Auslastung und Leistung von VM- oder Cloud-Instanzen überwachen und die Kapazität prognostizieren, gemessen an der Anzahl der Instanzen, der Instanzgröße oder einer Kombination aus beidem.
  • ungenutzte Ressourcen mit vergleichbaren Workloads auffinden und sich Konsolidierungsmöglichkeiten empfehlen lassen, um die Anzahl der Instanzen zu reduzieren, ohne die Leistung zu beeinträchtigen.
  • Cloud Workloads für Hybridumgebungen kennzeichnen, die – entweder in Bezug auf Preis oder Leistung – durch eine erneute Bereitstellung auf lokalen Servern besser bedient werden können.
  • Cloud-Instanzen identifizieren, die aufgrund ihrer vorhersehbaren oder relativ statischen Nutzungsmuster Kandidaten sind für das Überführen in günstigere Abrechnungsklassen, wie die kontinuierliche Nutzung oder reservierte Instanzen.
  • überproportionierten Speicher finden, der in Cold- oder Nearline-Dienste verschoben werden kann, um Geld zu sparen.

So kommen Sie an AIOps

Maschinelles Lernen, Wahrscheinlichkeitsrechnung und Simulationsalgorithmen verbessern die Effizienz und Effektivität von Infrastrukturmanagementsoftware. Daher integriert mittlerweile jeder größere Anbieter von Server-, Speicher-, Netzwerk- oder IT-Betriebsmanagement-Software AIOps-Funktionen in sein Produkt. Einige Beispiele für Unternehmen und Produkte, die sich auf AIOps zur Kapazitätsplanung und -optimierung konzentrieren, sind BMC Software, IBM, Quest, ServiceNow und Splunk.

AIOps können die Nutzung von Infrastrukturressourcen und die Anwendungsleistung zu geringeren Kosten spürbar verbessern; es optimiert die Workload-Platzierung und identifiziert nicht ausgelastete VMs, Instanzen und Speicherressourcen. Unternehmen mit großen Flotten von VMs und Cloud-Instanzen sollten mit AIOps in ihren Rechenumgebungen einen schnellen ROI (Return of Investment) erzielen.

Erfahren Sie mehr über Data-Center-Betrieb

ComputerWeekly.de
Close