Traditionelle Ansätze zur Verwaltung von IT-Infrastrukturen durch manuelle, menschliche Aufsicht funktionieren aufgrund der Komplexität in dynamischen Umgebungen nicht mehr. Die Menge der auszuwertenden Daten steigt exponentiell an. Die Leistungsüberwachung erzeugt eine immer größere Anzahl von Ereignissen und Warnungen.
Das Volumen der Service-Tickets nimmt mit der Einführung von IoT-Geräten, APIs, mobilen Anwendungen und digitalen oder maschinellen Nutzern ständig zu. Die „Consumerization“ der Technologie hat die Erwartungshaltung der User an die Funktionalität von Systemen nach oben geschraubt. Infrastrukturprobleme müssen mit immer höherer Geschwindigkeit angegangen und wenn möglich sofort behoben werden. Die Lösung dieses Problems heißt AIOps.
Einblicke in IT-Abhängigkeiten
AIOps ist die Abkürzung für „Artificial Intelligence for IT Operations“. AIOps verwendet einen Mix aus verschiedenen KI-Strategien, um IT-Assets zu überwachen und Einblicke in die Abhängigkeiten von IT-Systemen zu erhalten. AIOps basiert dabei auf der Zusammenführung der Daten aus dem IT Operations Management (ITOM – Metriken, Ereignisse) und dem IT Service Management (ITSM – Vorfälle, Änderungen). Der Hauptvorteil der Einführung von AIOps besteht darin, dass Operation-Teams die Geschwindigkeit und Flexibilität erhalten, die sie benötigen, um die Verfügbarkeit kritischer Services und die Bereitstellung eines optimalen digitalen Kundenerlebnisses sicherzustellen.
AIOps als CI/CD für IT-Kernfunktionen
AIOps-Plattformen kombinieren Big Data-, Analytik- und KI-Funktionen, um alle primären IT-Betriebsfunktionen wie Verfügbarkeits- und Leistungsüberwachung, Ereigniskorrelation und -analyse sowie IT-Service-Management und Automatisierung zu verbessern. Die „KI“ in AIOps bedeutet nicht, dass menschliche Bediener durch automatisierte Systeme ersetzt werden. Stattdessen arbeiten Menschen und die AIOps-Plattform zusammen, wobei die KI- und ML-Algorithmen die menschlichen Fähigkeiten erweitern und es Ops-Profis ermöglichen, sich auf das Wesentliche zu konzentrieren.
Eine AIOps-Plattform basiert auf fünf Arten von Algorithmen, die fünf Schlüsseldimensionen der Überwachung von IT-Vorgängen vollständig automatisieren und rationalisieren:
Datenauswahl
In jedem Unternehmen gibt es eine enorme Menge hochredundanter und verrauschter IT-Daten, die von einer modernen IT-Umgebung generiert werden. AIOps-Algorithmen sammeln aus einer Vielzahl von Daten aus verschiedenen IT-Betriebstools und -Geräten Daten und finden in Echtzeit bei der Zusammenführung der Daten die Datenelemente, die auf ein Problem hinweisen.
Mustererkennung
Die AIOps-Algorithmen korrelieren und finden Beziehungen zwischen den ausgewählten, aussagekräftigen Datenelementen und gruppieren diese zur weiteren Analyse.
Inferenz
AIOps-Algorithmen identifizieren die Hauptursachen für (wiederkehrende) Probleme, damit Maßnahmen ergriffen werden können.
Zusammenarbeit
AIOps-Algorithmen benachrichtigen Teams und erleichtern die Zusammenarbeit zwischen ihnen insbesondere dann, wenn Personen geografisch verteilt sind. Des Weiteren speichert es Daten zu Vorfällen, die die zukünftige Diagnose ähnlicher Probleme beschleunigen können.
Automatisierung
AIOps-Algorithmen automatisieren die Reaktion und Korrektur so weit wie möglich, um Lösungen präziser und schneller zu realisieren. Diese automatisierungsgesteuerten Erkenntnisse und Reaktionen führen zu kontinuierlichen Verbesserungen und Korrekturen. AIOps kann man sich als Continious Integration und Continious Delivery (CI/CD) für IT-Kernfunktionen vorstellen.
Abkehr von siloartiger Datenspeicherung
Tools zur Visualisierung bieten Dashboards zur Veranschaulichung von Berichten und Grafiken, damit Benutzer Änderungen und Ereignisse in der IT-Umgebung verfolgen und auf Situationen reagieren können, die Entscheidungen erfordern, die die AIOps-Software nicht treffen kann. AIOps erfordert aber eine Abkehr von einer siloartigen IT-Daten-Speicherung, um Beobachtungsdaten aus Überwachungssystemen und Job-Protokollen zusammen mit Eingriffsdaten aus Ticket-, Incident- und Event-Aufzeichnungen innerhalb einer Big-Data-Plattform zu aggregieren.