„Der Betrieb eines Rechenzentrums braucht eine DCIM-Lösung.“ Ist das so? Oder geht es manchmal auch einfacher, günstiger und vor allem effizienter? DCIM-Lösungen (Data Center Infrastructure Management) sind Systeme, die in Rechenzentren eingesetzt werden, um die Infrastruktur, sprich IT-Geräte, Gebäudetechnik, Stromversorgung, Temperatur und Platz zu überwachen, zu steuern und zu verwalten.
Sie erstellen Berichte zu Verfügbarkeit, optimieren die Ressourcenauslastung und liefern die Datengrundlage für Kapazitätserweiterungen und Upgrades. Die Vielzahl der Funktionen macht DCIM-Systeme häufig komplex und damit schwer bedienbar und langsam (und teuer). Gerade die Überwachung eines Rechenzentrums erfordert aber schnelle Reaktionszeiten. SLA-Verletzungen können hohe Strafzahlungen nach sich ziehen und ein nicht zeitnah entdeckter Ausfall kann schwerwiegende Folgen haben.
Hier kommen Monitoring-Tools ins Spiel. Klassische IT-Monitoring-Lösungen legen den Fokus auf Monitoring und auf Geschwindigkeit. Viele Monitoring-Lösungen können nahezu in Echtzeit reagieren und sind dank ihres klar umrissenen Aufgabenschwerpunkts noch relativ einfach und bedienbar und auch preislich günstig. Die ermittelten Monitoring-Daten lassen sich auch für Aufgaben einsetzen, die eigentlich in den Aufgabenbereich von DCIM-Lösungen fallen. Das können Berichte zur Ressourcenauslastung und zur Kapazitätsplanung sein oder die Automatisierung von Prozessen. Allerdings eignet sich nicht jede IT-Monitoring-Lösung auch für die Überwachung eines Rechenzentrums und für die Übernahme der erweiterten RZ-Management-Anforderungen.
Monitoring im Rechenzentrum
Nur ein Teil der RZ-Infrastruktur lässt sich mit klassischen IT-Mitteln wie SNMP, WMI oder Syslog hinreichend überwachen. Das funktioniert in der Regel für Hardware bei Storage-Systemen, Servern oder Netzwerkgeräten, manchmal auch noch bei Geräten zur Stromversorgung (USV) oder Umwelt-Sensorik (Temperatur, Luftfeuchtigkeit, Rauchmelder, Türschließanlagen…). Viele RZ-Komponenten sind allerdings nicht mit IT-Protokollen kompatibel, sondern können nur über spezielle Protokolle und Methoden abgefragt werden, die DCIM-Systeme in der Regel beherrschen. Im Wesentlichen sind das:
- Modbus: In der Gebäudetechnik ist Modbus im europäischen Raum wohl das verbreitetste Protokoll für die Kommunikation zwischen Überwachungssystemen und Gebäudekomponenten wie Klimaanlagen, Sicherheitskameras oder Zutrittskontrollsystemen.
- MQTT: Aus dem IoT-Umfeld kommend spielt MQTT in der Gebäudetechnik eine immer wichtigere Rolle, da es sich besonders gut für die Übertragung von Daten in Netzwerken mit begrenzter Bandbreite und/oder hoher Latenzzeit eignet.
- API: Immer mehr Geräte und Systeme in der Gebäudetechnik bieten definierte Schnittstellen (API) über die sie Daten und Informationen zu Zustand und Leistung bereitstellen. Solange eine IT-Monitoring-Lösung also nur klassische IT-Methoden unterstützt, eignet sie sich nur bedingt für den Einsatz im Rechenzentrum. Allerdings gibt es IT-Monitoring-Lösungen, die über reines IT-Monitoring hinaus auch entsprechende Protokolle und Methoden unterstützen, um Industrieanlagen, medizinische Infrastrukturen, IoT-Umgebungen und eben auch Komponenten der Gebäudetechnik bzw. des Rechenzentrums in das zentrale Monitoring einzubeziehen. Damit kann eine IT-Monitoring-Lösung eine wertvolle Ergänzung zu einem DCIM-System darstellen, die eine Echtzeit-Überwachung und -Alarmierung zu den Management-Funktionen des DCIM beisteuert. Aufgrund des vergleichsweise günstigen Preises, des geringen Implementierungsaufwands und der einfachen Bedienbarkeit kann sich das durchaus lohnen. Was muss eine Monitoring-Lösung aber leisten können, um tatsächlich ein DCIM-System zu ersetzen?
Monitoring statt DCIM?
DCIM bedeutet mehr als nur das Überwachen von Verfügbarkeit der RZ-Komponenten. Professionelle DCIM-Tools liefern Auswertungen und Berichte zum Zustand des Rechenzentrums, automatisieren Prozesse und unterstützen bei der Kapazitätsplanung. Um eine gangbare Alternative zu einem DCIM-System zu bieten, muss eine Monitoring-Lösung also mehr können, als RZ-Infrastrukturen nur zu überwachen.
#1 Auswertung und Publikation der Daten
Der Betrieb eines Rechenzentrums misst sich am Einhalten der SLA (Service Level Agreements), vertraglich definierter Verfügbarkeit im Verhältnis zu Ausfällen, deren Verletzung meist empfindliche Strafen nach sich zieht. Eine Monitoring-Lösung muss in der Lage sein, sogenannte SLA-Reports zu liefern, die Einhaltung oder Verletzung der SLAs berechnen und darstellen. Darüber hinaus müssen die Monitoring-Daten in Dashboards so dargestellt werden, dass Service-Techniker sich für die Behebung von Störungen oder Ausfällen räumlich orientieren können, sprich wenn eine Sicherheitskamera ausfällt, sollte auf einem Gebäudegrundriss ersichtlich sein, wo diese Kamera platziert ist und nicht einfach nur eine Identifikationsnummer der Kamera geliefert werden, die dann erst über Inventory-Tools oder Lagepläne lokalisiert werden muss.
#2 Prozessautomatisierung
Qualifizierte Fachleute sind heute rar gesät. Das hat zur Folge, dass die Belastung des Personals in Rechenzentren oft sehr hoch ist. Eine Möglichkeit dem entgegenzuwirken ist die Automatisierung von immer wiederkehrenden Prozessen. Damit können manche Probleme direkt ohne Eingreifen eines Experten behoben werden, andere können zumindest soweit vereinfacht werden, dass auch weniger qualifiziertes Personal die Aufgabe übernehmen und lösen kann. Voraussetzung ist, dass die eingesetzte Monitoring-Lösung die Möglichkeit bietet, statt einen Alarm zu verschicken ein vorbereitetes Skript auszulösen, das dann das Problem mittels Neustart oder auch durch komplexere Aktionen behebt. Von Vorteil ist auch, wenn die Lösung mehrere Komponenten in einem Prozess zusammenzufassen und damit die Ursache eines Problems identifizieren und beheben kann. Gleichzeitig könnte eine Nachricht an die zuständigen Techniker versendet werden, so dass diese informiert sind und beurteilen können, ob und wann ein weiteres Eingreifen nötig ist.
#3 Kapazitätsplanung
Rechenzentrum sind aufwändig und teuer. Zu viele Ressourcen (sei es in der IT, bei der Gebäudetechnik oder auch ganz simpel bei der Gebäudegröße bzw. -nutzung) verursachen unnötige Kosten, zu knappe Ressourcen können in vielerlei Hinsicht Probleme verursachen. Um Erweiterungen bedarfsgerecht planen zu können, braucht es langfristige Datenerhebung und die Möglichkeit, diese Daten auch entsprechend auszuwerten – sei es innerhalb der Lösung oder über einen Datenexport. Unterstützt eine IT-Monitoring-Lösung die benötigte Funktionalität, dann kann sie eine interessante Alternative zu einem DCIM-System darstellen:
- Viele IT-Monitoring-Tools sind schneller und einfacher als DCIM-Systeme. Schnellere Reaktionen, weniger Aufwand und damit auch Kostenersparnis sind Argumente, die für eine solche Alternative sprechen.
- IT-Monitoring-Lösungen können neben der RZ-Ausstattung auch die IT überwachen. Die Folge ist ein ganzheitlicher Überblick, der unter Umständen auch erweiterte Ursachenforschung ermöglicht und komplexe Zusammenhänge transparent machen kann, zum Beispiel zwischen IT-Applikationen und Raumtemperatur.
- Eine Lösung für IT und RZ verringert Kosten, Aufwand und Komplexität.
Vor allem für sehr große Rechenzentren können DCIM-Systeme aufgrund der komplexen Anforderungen manchmal unersetzbar sein. Aber auch in dem Fall kann ein einfaches und unkompliziertes Monitoring oft eine perfekte Ergänzung im täglichen Betrieb und bei der schnellen Fehlererkennung und Alarmierung sein.