
Shuo - stock.adobe.com
AIOps und Storage-Management: Funktionsweise und Tools
KI-gestützte Tools für das Speichermanagement und die Data Protection helfen dabei, Infrastrukturprobleme zu erkennen und die Leistung und sogar die Cloud-Kosten zu optimieren.
Künstliche Intelligenz (KI) kann in vielen Bereichen IT-Administratoren einen Teil der Arbeitslast abnehmen. Durch den Einsatz von KI zur Automatisierung sich wiederholender Aufgaben können IT-Teams mehr Infrastruktur effizienter und mit geringerem Risiko menschlicher Fehler verwalten.
KI-Systeme können schneller als Menschen auf Infrastrukturfehler reagieren und die Kapazität und Leistung verwalten, Administratoren über Data-Protection-Probleme informieren und dazu beitragen, die Kosten bei Cloud-Bereitstellungen zu optimieren.
Solche AIOps-Tools spielen mittlerweile eine immer größere Rolle im Speichermanagement. Die meisten Storage-Anbieter haben KI-basierte Tools eingeführt, um die großen Mengen an Verwaltungsdaten, die von Speichersystemen produziert werden, zu nutzen und die schnellen Gewinne, die mit einem besseren Speichermanagement einhergehen, zu erzielen.
In diesem Artikel werfen wir einen Blick auf die Angebote der wichtigsten Anbieter.
AIOps-Tools von Speicheranbietern
Hardwarelieferanten für Unternehmen haben ihre IT-Management-Tools zunehmend um AIOps-Funktionen erweitert. Sie nutzen Telemetrieverbindungen zu Hardware und maschinelles Lernen (oder KI), um die riesigen Datenmengen zu verarbeiten, Administratoren zu benachrichtigen oder sogar eine Fehlerbehebung zu versuchen.
Die Ansätze der Anbieter variieren jedoch, wobei einige das Speichermanagement in Allzweck-Toolsets integrieren und andere sich auf spezifische Anwendungsfälle wie das Rechenzentrum konzentrieren.
Es gibt auch einen aufstrebenden Markt für AIOps-Tools von Drittanbietern und Open-Source-Tools.
Dell Apex-AIOps
APEX AIOps von Dell bietet SaaS-basierte Observability und Verwaltung für alle IT-Systeme und Infrastruktur sowie Incident-Management. Das Tool funktioniert in der gesamten Kerninfrastruktur vor Ort von Dell, in Edge- und Multi-Cloud-Umgebungen sowie in der hyperkonvergenten Infrastruktur. Die drei Haupfunktionen lassen sich wie folgt zusammenfassen:
- Infrastructure Observability: KI-gesteuerte Beobachtbarkeit zur Optimierung des Zustands, der Cybersicherheit und der Nachhaltigkeit der Dell Infrastruktur.
- Application Observability: KI-gesteuerte Full-Stack-Beobachtbarkeit, die zur Optimierung der Anwendungsleistung in die Dell Infrastruktur integriert ist.
- Incident-Management: KI-gesteuerter Incident-Lebenszyklus-Workflow zur Optimierung der Verfügbarkeit Ihrer digitalen Infrastruktur.
APEX bietet Systemzustandsanalysen, Erkennung von Kapazitäts- und Leistungsanomalien, Leistungsprognosen und Informationen zu Sicherheitsrisiken. APIs ermöglichen es APEX, mit anderen Tools zusammenzuarbeiten. Es funktioniert mit allen Dell-Speichersystemen. Die Lösung soll Infrastrukturintegrität, Anwendungsausfallsicherheit und automatisierte Serviceverfügbarkeit sicherstellen. Weitere Details sind auf der Webseite des Anbieter zu finden.
Hitachi Vantara Ops Center
Das Hitachi Ops Center von Hitachi Vantara umfasst KI-gesteuerte Systemkonfigurations-Tools, Leistungsanalysen, Workflow-Automatisierung und -Beobachtbarkeit sowie Data Protection. Die Lösung besteht aus mehreren Komponenten: Hitachi Ops Center Administrator, Hitachi Ops Center Analyzer, Hitachi Ops Center Automator und Hitachi Ops Center Protector.
Das Hitachi Ops Center konzentriert sich auf das Rechenzentrumsmanagement und nutzt KI und maschinelles Lernen für Prognosen, Leistungsoptimierung und zur Vorhersage von Fehlern. Das Ops Center kann virtuelle Maschinen verwalten und optimieren und Daten von mehreren Speichersystemen sammeln und rechenzentrumsprozesse automatisieren. Der Hitachi Ops Center Administrator zielt darauf ab, die Speicherverwaltung auf der gesamten Virtual Storage Platform von Hitachi zu reduzieren und das Speicher-Provisioning umzusetzen. Der Anbieter verspricht weniger Aufwand und Komplexität sowie Hochverfügbarkeit und Workload-Agilität.
Der Analyzer übernimmt das Sammeln und Auswerten der Daten. Er bietet ein globales Dashboard für die Speicherinfrastruktur. Mit den Analyseergebnissen sollen Anwender Ressourcen optimieren, deren Nutzung effizienter machen, Probleme schneller beheben und Automatisierungen erleichtern.
Der Ops Center Automator ermöglicht unter anderem intelligente Provisionierung für automatische Ressourcenauswahl, rollenbasierte Zugriffskontrolle, REST-API für die Integration der Verwaltungssoftware und KI-fähige proaktive Korrekturen. Mit dem Ops Center Protector können IT-Teams moderne Backup- und Recovery-Vorgänge mit Copy Data Management umsetzen. Dabei kann der Datenkopiervorgang automatisiert werden. Die Lösung soll anwendungskonsistenete Kopien und Remote-Replikation für Disaster Recovery gewährleisten. Eine Übersicht und weitere Ressourcen stellt Hitachi auf seiner Webseite zur Verfügung.
HPE Infosight AI
HPE InfoSight AI unterstützt die Speicherprodukte Alletra, 3Par, Primera und Nimble des Anbieters. InfoSight ist für Benutzer mit einem Support-Vertrag kostenlos. Es verwendet APIs zur Automatisierung der Hardwareverwaltung, einschließlich der von HPE-Partnern. Dazu gehören die Vorhersage und Vermeidung von Ausfallzeiten, Kapazitätsprognosen und Signaturerkennung.
InfoSight arbeitet mit dem OneView-IT-Management-Tool von HPE für softwaredefinierte Infrastrukturen zusammen. Die Funktionsweise besteht aus fünf Schritten. Als erstes werden tiefe Telemetriedaten aller verbundenen Systeme des Herstellers gesammelt, analyisiert und nach Anomalien untersucht. Danach wird ein Fall erstellt (Case Creation), wobei ein sich ständig weiterentwickelnder Katalog von Supportfällen für die gefundenen Problemeangelegt wird. Danach erfolgt eine Root-Cause-Analyse. Hierfür werden Telemetriedaten und KI genutzt, um Probleme im gesamten Stack zu beheben, sei es im Host, in VMs, im Netzwerk, bei der Interoperabilität, bei Konfigurationen oder beim Speicher. Schritt vier ist die eigentliche Fehlerbehebung. Dabei wird ein einen Fingerabdruck für das gelöste Problem und andere IT-Umgebungen mithilfe der Mustererkennung überprüft. Im letzten Schritt wird eine Problemverhinderung umgesetzt, wobei andere IT-Umgebungen darauf geprüft werden, ob sie eventuell das gleiche Problem entwickeln. Hier erfolgt dann eine automatische Empfehlung für die Fehlerverhinderung.
Weitere Informationen zu der HPE-Lösung sind auf dieser Webseite zu finden.
Huawei Data Management Engine
Die Data Management Engine (DME) von Huawei ist eine Betriebs- und Wartungsplattform. Sie umfasst eine Leistungsvorhersage und Fehlererkennung. DME überprüft die korrekte Lastverteilung und kann eine Ursachenanalyse von Fehlern durchführen. AIOps von Huawei umfasst auch Optionen für das Cloud-Management und für virtualisierte Umgebungen. Die Lösung gewährleistet automatische Service-Bereitstellung und verspricht Performance-Probleme in SAN-Umgebungen in nur drei Minuten aufzudecken, in fünf Minuten zu markieren und innerhalb von zehn Minuten zu lokalisieren. Für NAS-Systeme gibt der hersteller einen Zeitraum von nur zwei Minuten zur Problemerkennung an. Das Tool identifiziert sechs Hauptrisiken folgender Parameter: Kapazität, Konfiguration, Performance, Disaster Recovery, Hardware und recyclebare Ressourcen.
Für die Datenwiederherstellung – auch von großen Datenmengen – kommt eine Suchmaschine für das Rechenzentrum zum Einsatz, die mehr als 15 Suchkriterien verwendet, was ein schnelles Restore ermöglichen soll. Für die Datenmobilität werden automatisch aktuelle und ältere Daten identifiziert und klassifiziert, was eine stufenbasierte Datenmobilität ermöglicht. Durch die Erkennung und automatische Löschung ungültiger oder veralteter Daten können Speicherkosten gesenkt werden.
Die Integration von DME mit den wichtigsten Cloud-Management-Plattformen und ITSM erfolgt über offene APIs, Scripts und Plug-ins. Es gibt zwei Arten der Bereitstellung: Software und Anwendung. Bei der Anwendungsbereitstellung sind keine zusätzlichen Ressourcen erforderlich, was die Rollout-Zeit laut Anbieter um 90 Prozent verkürzt.
Detailliertere Informationen sowie zusätzliche Ressourcen zu DME von Huawei sind auf der Herstellerwebseite zu finden.
IBM Storage Insights
IBM stellt Abonnenten von Storage Insights Pro sein Tool Storage Insights für die Blockspeicherverwaltung zur Verfügung. Es unterstützt auch einige Speichertechnologien von Dell EMC, Hitachi Vantara, NetApp und Pure Storage. Das Tool ist ein Cloud-basierter Service, der über Datenkollektoren in den IBM-Systemen Daten für die Analyse und Optimierung von Storage-Umgebungen zur Verfügung stellt. Es kombiniert IBM-Datenmanagement mit proprietären Analysen von IBM Research.
Der Anwender installiert dafür den Datenkollektor auf einen Server in seinem Rechenzentrum herunter, der dann die Metriken des Speichers sammelt und an Storage Insights sendet. Die Lösung bietet eine zentrale Überwachung der Speicherumgebung, wobei Server, Anwendungen, SAN und Dateisystem geprüft werden. Die Pro-Version des Tools empfiehlt passende Storage Tiers, die auf der tatsächlichen Datennutzung basieren. Der Hersteller verspricht, das Serviceniveau bei der Migration von einem Tier zu einem anderen nicht zu beeinträchtigen. Insights Pro wurde für den Einsatz mit Block-, Datei- und Objektspeicher konzipiert. Storage Insights steht für den Einsatz mit Block Storage des Anbieters sowie mit externem Speicher bereit.
Darüber hinaus ünterstützt das Tool Spectrum Virtualize for Public Cloud in der IBM-Cloud und in AWS. Dies soll eine umfassende Sicht auf die gesamte Multi-Cloud-Speicherinfratrsuktur ermöglichen. Weitere Informationen stellt der Anbieter auf seiner Produktwebseite zur Verfügung.
Darüber hinaus nutzt IBM Turbonomic künstliche Intelligenz, um Leistung, Kosten und Konformität von hybriden Cloud- und Multi-Cloud-Umgebungen zu verbessern. Dafür führt das Tool eine Reihe von Datenpunkten zur Optimierung der Cloud-Kosten zusammen – dies funktioniert wiederum mit Instana Observability. Instana bietet auch eine automatisierte Ressourcenzuweisung und -optimierung sowie ein KI-gestütztes Vorfallmanagement. Turbonomic soll für effizientes Management von Anwendungsressourcen sorgen. Weiterführende Informationen finden Sie hier.
NetApp BlueXP
NetApp Keystone Storage as a Service (STaaS) basiert auf AIOps. Dadurch können Benutzer laut Anbieter Cloud-ähnliche Funktionen mit lokaler Speicherhardware erstellen.
Dabei wird der digitale Berater NetApp BlueXP verwendet, der wiederum auf dem Active IQ Digital Advisor von NetApp läuft. Die Tools bieten Nutzungs- und Kapazitätsprognosen sowie Sicherheits- und Anomalieerkennung. Diese stammen aus den Data Infrastructure Insights von NetApp, ehemals Cloud Insights. Keystone STaaS bietet auch Abonnement-Benachrichtigungen zur Kostenoptimierung für On-Demand-Speicher.
BlueXP gibt dabei Einsicht in die gesamte Speicher- und Dateninfrastruktur sowohl im eigenen Rechenzentrum als auch in der Cloud. Die Lösung soll nahtloses Datenmanagement, vereinfachte Betriebsprozesse, weniger Fachkräfteeinsatz und Kostenkontrolle gewährleisten. Zusätzliche Informationen zu BlueXP sind in englischer Sprache auf der Netapp-Webseite zu finden.
Außerhalb von Keystone STaaS automatisiert Active IQ die Speicherintegrität und Kostenoptimierung sowie die Sicherheit und Ausfallsicherheit für andere NetApp-Produkte. Der Digital Adviser deckt die Infrastrukturoptimierung ab, während ein Dashboard für die betriebliche Ausfallsicherheit mit lokalen ONTAP-Clustern zusammenarbeitet, um Schwachstellen zu minimieren. Active IQ nutztt dafür Telemetriedaten von Systemen seiner Anwender-Community für prädiktive Analysen. Details zu Active IQ sind in einem Datenblatt aufgeführt.
Neben Keystone und ONTAP funktioniert NetApp Active IQ auch mit E-Series- und StorageGRID-Speicher.
Nutanix AOS
Hersteller Nutanix hat umfassende KI-Funktionen in seine HCI-Software AOS Nutanix integriert, um verschiedene Optimierungs- und Analyseverfahren zu ermöglichen. So hilft die KI dabei, die Workloads und Infrastruktur zu überwachen und somit Probleme und Engpässe nch vorm Entstehen zu erkennen. Selbstheilung und automatische Ressourcenverteilung erfolgen ebenso mit KI-Unterstützung. Das Tool platziert Workloads auf den passenden Knoten und gibt Empfehlungen für die Kapazitätsplanung. Zu den weiteren Funktionen zählen Anomalieerkennung, Echtzeitwarnungen, Identifizieren der besten Backup-Fenster, intelligente Workload-Migration, Cloud-Unterstützung und präzise Fehlerdiagnose sowie dynamische Anpassungen der Workloads.
Zusätzlich zu diesem Tool offeriert der Anbieter Nutanix GPT-in-a-Box. Dies ist eine KI-fähige Infrastruktur, die im Kern und am Edge der IT-Landschaft implementiert werden kann. Die Basis bildet Nutanix AOS für die Virtualisierung der Compute-, Storage- und Netzwerkressourcen sowie die Skalierbarkeit und Performance für die KI-Workloads. Die Lösung nutzt unter anderem NVDIA-GPUs für die KI-Beschleunigung und Nutanix Files und Nutanix Objects als Speichersysteme für die Trainings- und Inferenzdaten. Die Software Prism Central des Herstellers dient als Verwaltungsoberfläche. Darüber hinaus werden KI-Frameworks wie TensorFlow, PyTorch und Hugging Face unterstützt. Anwender haben die Option, vortrainierte GPT-Modelle zu integrieren oder benutzerdefinierte Modelle zu trainieren. Um KI-Modelle als Microservices bereitstellen zu können, unterstützt das Tool Kubernetes und Container. Ein Zero-Trust-Ansatz sorgt für optimierte Sicherheit. Die Lösung richtet sich vor allem an ML-Administratoren und Data Scientists. Weitere Details zu Nutanix GPT-in-a-Box sind auf der Webseite des Anbieters zu finden.
Pure Storage Pure1 AIOps
Pure1 AIOps ist eine SaaS-Speicherverwaltungsplattform, die Speicheroptimierung, Purity-Upgrades (Betriebssystem) und Abonnementverwaltung für On-Demand-Speicher umfasst.
Pure1 umfasst Speicherplanung und interne Rückverrechnungsberechnungen, Workload-Platzierung und Lebenszyklusverwaltung. Pure1 wird mit allen Abonnements und Supportverträgen des Anbieters geliefert.
Das Tool erlaubt prädiktive Einblicke, mit der sich die Planung von Performance und Kapazität besser umsetzen lassen soll. Dafür kommen Telemetriedaten aller Pure-Storage-Systeme zum Einsatz. Anwender erhalten damit Hilfestellung bei der Implementierung neuer Anwendungen und bessere Vorrausplanung durch Workload- und Hardware-Simulation. Wie bei anderen Lösungen auch, nutzt Pure1 KI und ML, um mögliche Fehler zu erkennen, Workloads besser zu platzieren und Upgrades zum richtigen Zeitpunkt durchzuführen.
Pure plant außerdem die Einführung eines KI-Copiloten für Speicher, der Funktionen wie die Erkennung von Bedrohungen sowie die Verwaltung der Speicherleistung umfassen wird.
Umfassende Informationen zum Funktionsumfang und zur Funktionsweise von Pure1 und Pure1 Meta sind auf der Herstellerwebseite nachzulesen.
AIOps von Drittanbietern, Open Source und Cloud
Die AIOps-Tools von Drittanbietern versprechen eine enge Integration mit ihrer Speicherhardware und oft auch mit anderen Teilen ihres Stacks. Die herstellerübergreifende Kompatibilität ist jedoch eingeschränkter oder wird oft gar nicht unterstützt.
Eine Reihe von AIOps-Tools von Drittanbietern zielen darauf ab, die Lücke für Umgebungen mit mehreren Anbietern zu schließen. Ein Beispiel ist ignio von Digitate, ein SaaS-basiertes Tool, das Automatisierung, Beobachtbarkeit und Fehlersuche bietet.
Auch die Open-Source-Community hat AIOps-Tools entwickelt, wobei es sich bei vielen dieser Tools eher um Komponenten als um vollständige AIOps-Tool-Sets handelt. Zu diesen Tools gehören AIOpsTools, Grafana und Prometheus.
Auch die Cloud-Hyperscaler bieten einige AIOps-Funktionen an. Obwohl es nicht speziell auf die Speicherung ausgerichtet ist, bietet beispielsweise Amazon Lookout for Metrics von AWS Leistungsüberwachung und Anomalieerkennung für AWS- und Drittanbieter-Cloud-Apps.