AIOps wurde früher nur als Back-Office-Grundlage betrachtet, eine solide Suite von Tools, die routinemäßige Sicherheits- und Netzwerküberwachungsaufgaben vereinfachten, die hauptsächlich dem IT-Shop dienten.
Das beschleunigte Tempo der digitalen Transformation ändert das. Jetzt stehen IT-Service- und Betriebsteams im Rampenlicht und haben die Aufgabe, die Business Performance zu ermöglichen, die ihren Unternehmen dabei hilft, nahtlose digitale Erlebnisse zu bieten und sich in einem sich schnell ändernden wirtschaftlichen Umfeld zu entwickeln.
AIOps ist der Schlüssel zur Transformation des Unternehmens, um agiler zu werden, indem es der IT-Abteilung hilft, proaktiver und vorausschauender zu werden. So können Herausforderungen, die zu kostspieligen Ausfallzeiten führen könnten, antizipiert werden, bevor sie auftreten. AIOps ermöglicht es Maschinen, IT-Probleme selbst zu lösen, indem ein mehrschichtiger Ansatz verwendet wird, der den Betrieb der IT durch maschinelles Lernen (ML) und Analysen verbessert, um Big Data zu analysieren, die mit verschiedenen Tools gewonnen wurden. Diese Kombination kann IT-Probleme in Echtzeit automatisch erkennen und darauf reagieren sowie die kontinuierliche Integration und Bereitstellung (CI/CD) für zentrale Technologiefunktionen unterstützen. Es ist auch wichtig, dass AIOps-Tools einen offenen Ansatz haben, der sich in vorhandene IT-Tools und Datenquellen integrieren lässt, angesichts des breiten Spektrums an zu beobachtenden und zu analysierenden Daten.
Da die Unternehmenssysteme in den letzten Jahren immer komplexer wurden, brauchten IT-Expert*innen Möglichkeiten, die riesigen Datenmengen zu nutzen, die ihnen zur Verfügung stehen. Die Anwendung von ML auf diese Daten wich AIOps. So wie sich AIOps weiterentwickelt hat, um die Anforderungen von IT-Betriebsteams zu erfüllen, haben sich auch IT-Betriebsteams weiterentwickelt, um die Anforderungen ihres Unternehmens zu erfüllen. Sie sind mit einem enormen Anstieg der Betriebsdatenmengen, der zunehmenden Komplexität von IT-Umgebungen aufgrund von Multi-Cloud- und Remote-Arbeitsumgebungen, agilen Entwicklungsmethoden und Initiativen zur digitalen Transformation mit neueren Anwendungsarchitekturen wie Containern und kurzlebigen Workloads konfrontiert.
Allein im letzten Jahr war das Tempo der Veränderungen bemerkenswert. Eine kürzlich von Hanover Research durchgeführte Studie über IT-Abteilungen großer Unternehmen ergab, dass mehr als zwei Drittel der Unternehmen (69 %) inzwischen Künstliche Intelligenz für den IT-Betrieb und das IT-Service-Management einsetzen. Darüber hinaus wird erwartet, dass die Marktgröße der AIOps-Plattform bis 2023 auf 11,02 Milliarden anwachsen wird, was Geschwindigkeit und Genauigkeit bei der Lösung weitreichender IT-Probleme in großem Maßstab verspricht.
Automatisierung ist am effektivsten, wenn sie innerhalb streng definierter Prozesse und Arbeitslasten angewendet wird, die manuell sind und sich wiederholen. AIOps reduziert die Zeit, die hochqualifizierte Ingenieur*innen für diese Aufgaben aufwenden, und ermöglicht es ihnen, sich auf höherwertige Initiativen innerhalb des Unternehmens zu konzentrieren. AIOps unterstützt die IT-Abteilung bei der Bewältigung komplexer Herausforderungen und der Bewältigung des exponentiellen Datenwachstums, indem es den gesamten IT-Betriebsprozess in hybriden Umgebungen automatisiert, um ein genaues Inventar für Maschinen zu erstellen, Datenpunkte unabhängig voneinander zu korrelieren und sie auf ML anzuwenden, um Muster in vier Schlüsselbereichen zu erkennen: Reduzierung des „Ereignisrauschens“, prädiktive Alarmierung, Analyse wahrscheinlicher Ursachen und Kapazitätsanalyse.
Rauschunterdrückung bei Ereignissen und prädiktive Alarmierung
IT-Teams haben Schwierigkeiten, die große Anzahl von falschen Ereignissen und Warnungen von den verschiedenen Überwachungstools zu verwalten, die in ihrer Umgebung installiert sind. Es ist eine ihrer größten Herausforderungen. Während die Warnungen manchmal hilfreich sein können, überladen sie den Posteingang häufiger und verursachen Fehlalarme.
AIOps reduziert das „Rauschen“ von Ereignissen in einer Umgebung, indem es lernt, wie sich eine Umgebung sowohl in geschäftigen als auch in langsamen Zeiten verhält. Dieses Wissen wird dann verwendet, um zu bestimmen, ob eine bestimmte Warnung auf einen größeren Vorfall mit möglichen Auswirkungen auf den Dienst hinweist oder nicht. Darüber hinaus werden IT-Teams nur dann gewarnt, wenn das Verhalten der Umgebung auf ein anormales Verhalten hindeutet, das auf eine Verschlechterung von Apps oder Diensten oder Systemausfallzeiten hindeutet. Dies hilft bei der Priorisierung und steigert die Effizienz. So konnte beispielsweise ein Anbieter von hybriden IT-Lösungen mithilfe von AlOps das „Ereignisrauschen“ um 90 % reduzieren und die Kosten senken, indem er monatlich 10.000 Tickets auf wenige Hundert reduzierte.
Dieselben Informationen, die zur Reduzierung von „Ereignisrauschen“ gesammelt wurden, können auch auf prädiktive Warnungen angewendet werden. In diesem Szenario identifiziert AIOps harmlos aussehende Ereignisse zur weiteren Auswertung, da diese Ereignisse in der Vergangenheit zu größeren Problemen beigetragen haben. Dies ermöglicht einen proaktiven Ansatz zur Behebung von Problemen und verhindert Serviceausfälle für Kund*innen.
Wahrscheinliche Ursachen- und Kapazitätsanalyse
In einer herkömmlichen Umgebung kann es sehr viel Zeit und Energie kosten, zu verstehen, warum und wie ein Problem ursprünglich aufgetreten ist. Dieser Prozess kann jedoch durch den Einsatz von KI automatisiert werden, um die wichtigsten Kausalknotenpunkte zu ermitteln. Zum Beispiel den genauen Ort des Problems und die damit verbundenen Ereignisse, was letztendlich dazu beiträgt, die mittlere Reparaturzeit (MTTR) zu verringern. Von dort aus kann die AIOps-Lösung die Daten analysieren und das Problem in Minuten oder sogar Sekunden statt in Stunden identifizieren.
AIOps kann auch eine Topologieansicht bieten, die die Auswirkungen, den spezifischen Knoten, die Anzahl der aufgetretenen Ereignisse und alle abgeschlossenen Änderungsanforderungen anzeigt. Auf diese Weise können IT-Teams die Änderungen und Ereignisse, die an diesen spezifischen Knotenpunkten auftreten, untersuchen und den wahrscheinlichen Prozentsatz des Knotens ermitteln, der für die tatsächliche Verschlechterung des Dienstes verantwortlich ist.
IT-Teams müssen auch den Ressourcenverbrauch vor Ort und in der Cloud verstehen. Durch Erkenntnisse aus dem Verhalten und fortschrittliche Analysen können AIOps ein besseres Kapazitätsmanagement ermöglichen und verstehen, welche Ressourcen wann genutzt werden. Noch wichtiger ist, dass AIOps feststellen kann, welche Ressourcen benötigt werden, um die von den Kund*innen am meisten nachgefragten Anwendungen und Dienste zu unterstützen. Dies ermöglicht die Planung künftiger Anforderungen und gibt IT-Teams die Möglichkeit, die Ressourcen richtig zu dimensionieren, sodass die Kosten niedrig bleiben und die Anwendungen wie erwartet funktionieren.
Übernahme und Integration in DevOps-Frameworks
AIOps reduziert die Zeit, die hochqualifizierte Ingenieur*innen für diese Aufgaben aufwenden müssen, und ermöglicht es ihnen, sich auf höherwertige Initiativen innerhalb des Unternehmens zu konzentrieren.
AIOps wird zunehmend in DevOps-Frameworks integriert, insbesondere bei der Erfassung und Analyse von Protokollen und der Identifizierung von Risiken im Code. In Zukunft wird sich die Verwendung von AIOps im DevOps-Framework von einem Fokus auf die Vorproduktion auf Produktionsmetriken wie Userbindung, Qualität und Geschäftsrelevanz verlagern. All dies bedeutet, dass es starke Belege dafür gibt, dass DevOps-Teams, die AIOps-Plattformen zur Überwachung und Unterstützung von Anwendungen nutzen, ihre Zeitpläne beschleunigen und die Entwicklung rationalisieren können.
Der richtige Zeitpunkt ist jetzt
Die digitale Transformation bedeutet eine Verlagerung von der zentralisierten IT hin zu Anwendungen und Entwickler*innen, ein höheres Innovationstempo und eine schnellere Bereitstellung sowie den Erwerb neuer digitaler User wie beispielsweise Maschinenagenten, Internet-of-Things (IoT)-Geräte, Anwendungsprogrammschnittstellen (APIs), die Unternehmen bisher nicht bedienen mussten.
All diese neuen Technologien und User bringen die herkömmlichen Strategien und Tools für das Leistungs- und Servicemanagement an ihre Grenzen. AIOps ist die beste Strategie für das IT-Betriebsteam, um diese Probleme der digitalen Transformation zu bewältigen. AIOps transformiert den IT-Betrieb so, dass automatisierte und KI-basierte Analysen auf eine breite Palette von Daten angewendet werden, die in eine moderne und offene Beobachtungsplattform eingespeist werden, sodass sich die Teams auf die Förderung der operativen Exzellenz konzentrieren können und das Unternehmen sich zu einem Autonomous Digital Enterprise entwickeln kann.
AIOps wird es ITOps ermöglichen, Infrastruktur, Anwendungen und Services über hybride Cloud-Ökosysteme hinweg intelligent zu orchestrieren, um sich auf das Geschäft auszurichten und Kundenbedürfnisse bedarfsgerecht zu erfüllen. Unternehmensleiter*innen müssen die Notwendigkeit erkennen, die gesamte IT-Umgebung digital zu transformieren, um ein intelligentes Unternehmen zu unterstützen, das die Anforderungen des sich schnell verändernden digitalen Marktes erfüllen kann.