Getty Images/iStockphoto

Die richtigen Metriken für den IT-Betrieb nutzen

Die Menge der in IT-Umgebungen gesammelten Daten kann überwältigend sein. Wenn IT-Betriebsteams auf die Benutzererfahrung fokussieren, können sie die wichtigsten Metriken bestimmen.

Viele IT-Organisationen konzentrieren sich auf Aktivitätsmetriken wie die Gesamtzahl der zwischen einem Benutzer und jeder Anwendungskomponente gesendeten und empfangenen Nachrichten oder die insgesamt genutzte Datenkapazität. Diese Informationen sind jedoch nur von begrenztem Wert, da sie sich nicht auf die Erfahrungen der Benutzer selbst beziehen.

Der Zweck der IT ist es, eine zufriedenstellende Erfahrung zu liefern, bei der der Benutzer - ob Mitarbeiter, Kunde, Interessent oder Partner - die Rolle spielt, die das Unternehmen erwartet. Die Erfahrung des Benutzers ist die wahrgenommene Qualität der Interaktion, einschließlich aller technischen Elemente oder Dienste, die dazu beitragen.

Daher ist es nicht verwunderlich, dass die Optimierung des IT-Betriebs (IT Operations) auch die Optimierung der Erlebnisqualität (QoE) bedeutet. Dies wiederum bedeutet, dass die Faktoren gemessen werden müssen, die die Benutzererfahrung beeinflussen.

Erlebnisqualität vs. Servicequalität

Die ursprüngliche Definition von QoE ist aus dem Netzwerkkonzept der Servicequalität (QoS) hervorgegangen.

QoS misst Faktoren wie die Rate der übertragenen Informationen, Paketverluste und Verzögerungen, einschließlich Jitterund Schwankungen. Obwohl QoS-Metriken bei der Messung von QoE nach wie vor wichtig sind, sind sie weniger wichtig als anwendungsbezogene Metriken, die schwieriger zu identifizieren und zu erfassen sein können.

Sichtbarkeit (Visibility) und Beobachtbarkeit (Observability) sind bei der Erfassung von Metriken wichtig. Viele der in IT- und Netzwerkumgebungen verfügbaren Daten sind jedoch wenig bis gar nicht geeignet, um die tatsächliche Qualität der Benutzererfahrung mit einer Anwendung zu bewerten.

Das zentrale Leitprinzip der IT-Ops-Metriken besteht darin, dass Anwendungen ihren Geschäftszweck unterstützen sollten, was bedeutet, dass sie das Unternehmen unterstützen. Die IT-Teams, die die Anwendungen nutzen, legen wiederum die Qualitätsanforderungen fest, und die QoE-Metriken sind der Schlüssel zur objektiven Bewertung, ob diese Anforderungen erfüllt werden.

Beginnen Sie mit der Erfassung von Benutzerinteraktionen

Der erste Schritt zum Verständnis der QoE ist die Katalogisierung der Benutzerinteraktionen. Um den IT-Betrieb erfolgreich zu optimieren, ist es unerlässlich, jede Interaktion eines Benutzers mit einer Anwendung zu erfassen.

Wenn ein Benutzer eine Aufgabe erfüllen möchte, führt er eine Reihe von Interaktionen durch, die ihm das gewünschte Ergebnis liefern. So kann sich ein Benutzer beispielsweise anmelden, eine Anfrage stellen, einige sekundäre Anfragen und Aktualisierungen durchführen und sich dann abmelden.

Sobald der Benutzer diese Reihe von Aktionen eingeleitet hat, ist er gebunden, bis sie abgeschlossen ist. Alles, was zu Verzögerungen, Verwirrung oder Fehlern führt, wirkt sich negativ auf die Erfahrung des Benutzers aus - und auch auf die geschäftliche Rechtfertigung für die von ihm genutzten IT-Ressourcen.

Wählen Sie Metriken, die das Benutzererlebnis veranschaulichen

Da die Verbesserung der Benutzerinteraktionen die Grundlage für die Optimierung des IT-Betriebs ist, sollten Unternehmen damit beginnen, die Metriken zu erfassen, die diese Interaktionen auf Benutzerebene beschreiben. 

Fragen könnten hier sein: Wie lange dauert es ab dem Zeitpunkt, an dem ein Benutzer versucht, sich anzumelden, bis er den Bildschirm sieht, auf dem er nach einer ID und einem Passwort gefragt wird? Wie lange dauert es nach der Eingabe der Anmeldedaten, bis er Zugang erhält?

Erfassen Sie die Zeitreihen für jede Dateneingabe. Idealerweise sollte dies so nah wie möglich an dem Punkt geschehen, an dem der Benutzer die Verbindung herstellt. In einigen Fällen ist jedoch das erste für die IT-Abteilung sichtbare Ereignis der Zeitpunkt des Eingangs einer Nachricht vom Benutzer und der Zeitpunkt des Versands einer Antwort, zusammen mit der Anzahl der Nachrichten in jeder Kategorie.

Bei der Auswahl der zu erfassenden Metriken sollten Sie darauf achten, die Anwendungs- und Netzwerkleistung zwischen Benutzer und Anwendung zu messen. Stellen Sie sich die Interaktion als ein Diagramm von Schritten vor, wobei jeder Schritt eine messbare Arbeit darstellt, die zur Unterstützung des Benutzers geleistet wird.

Nützliche Metriken für den IT-Betrieb beschreiben, wie jeder Schritt in Bezug auf das Volumen – zum Beispiel die Anzahl der Nachrichten und das Datenvolumen – und die Prozesszeit abläuft. Ziel ist es, zu verfolgen, wie viel Zeit jede Interaktion in Anspruch nimmt, und alle Punkte zu identifizieren, an denen Informationen verloren gehen oder beschädigt werden.

Um die erforderlichen Daten zu sammeln, müssen in einem nächsten Schritt die mit den Interaktionen verbundenen Arbeitsabläufe verfolgt werden. Betrachten Sie eine Anwendung als eine Reihe von Komponenten, die auf der logischen Ebene durch Workflows und auf der physischen Ebene durch Netzwerkverbindungen miteinander verbunden sind. Da jede Interaktion eine Reihe von Workflows erzeugt, bedeutet die Messung der QoE die Erfassung von Workflow-Daten.

Wenn möglich, sollten Sie Metriken sowohl auf der Netzwerk- als auch auf der Anwendungsebene erfassen, um eine Korrelation zu ermöglichen. Zu den Metriken auf Netzwerkebene sollten die Anzahl der Nachrichten, die Auslastung und die Verlust-Verzögerungs-Informationen gehören, und zwar so granular wie möglich. Daten auf Anwendungsebene sollten auch Nachrichtenzählungen enthalten, um die Korrelation zu erleichtern, aber insgesamt sollten sie sich auf die Prozesszeiten konzentrieren.

Sammeln und Analysieren von IT-Betriebsmetriken

Das Sammeln der für die QoE-Bewertung erforderlichen Metriken kann eine große Herausforderung darstellen.

Um Metriken zu sammeln, können IT-Teams Netzwerkmanagementsysteme, Public-Cloud-Plattformen, Plattformsoftware-Tools – einschließlich Container-Management – und Protokolle aller Art verwenden. Unterschiedliche APIs und Datenformate können jedoch die Korrelation von Daten erschweren.

Nach der Verfolgung der Arbeitsabläufe und der Identifizierung der zugehörigen Komponenten müssen Sie die verfügbaren APIs, Datenformate und alle verfügbaren Tools ermitteln, um die Informationen in einer gemeinsamen Datenbank für die Analyse zu harmonisieren. Rechnen Sie damit, dass dieser Prozess viel Zeit und Tests erfordern wird.

Tools für die Verwaltung von IT-Betriebskennzahlen

Die Marktreaktion auf den Bedarf an einer organisierten Methode zur Verwaltung von QoE-Metriken ist die umfassende verfügbare Produktpalette für Sichtbarkeit oder Observability. Viele Anbieter, darunter AppDynamics und Dynatrace, bieten Tools an, die QoE-bezogene Metriken sammeln und harmonisieren, zumindest bis zu einem gewissen Grad.

Um die Herausforderungen bei der Verknüpfung eines Full-Stack-Systems mit jeder Quelle von Metriken in Ihrer IT-Umgebung zu verringern, sollten Sie das OpenTelemetry-Framework, ein Projekt der Cloud Native Computing Foundation, verwenden. OpenTelemetry ist ein aufkommender Standard, der eine Verknüpfung zu Cloud Computingschafft, aber nicht spezifisch ist.

Das OpenTelemetry-Framework konzentriert sich auf zeitbasierte Metriken, die für die Verknüpfung spezifischer Kennzahlen mit der QoE entscheidend sind. Die breite Herstellerunterstützung des Frameworks garantiert nicht, dass Metriken von jedem Element in Ihrer IT-Umgebung effektiv erfasst werden können, erhöht aber zumindest die Chancen.

Erfahren Sie mehr über Data-Center-Betrieb

ComputerWeekly.de
Close