Die Speicherinfrastruktur spielt in heutigen, datengesteuerten Unternehmen eine immer noch zunehmend wichtige Rolle. Das betrifft nicht zuletzt Sicherheit und Verfügbarkeit der Daten. Hier sielen Funktionen wie Datenreplikation und schnelle Disaster Recovery eine große Rolle.
Oft zeigen sich Menschen beeindruckt von den schieren Datenmengen, die heutige Storage-Systeme im Vergleich zu früheren Zeiten speichern und bereitstellen müssen. Die wesentlichen Fortschritte wurden allerdings bei Datenverfügbarkeit und Wiederherstellungszeiten erzielt und hier insbesondere bei Widerherstellungszeitpunktziel (Recovery Time Objective: RTO) und Wiederherstellungspunktziel (Recovery Point Objective: RPO). Ein Blick zurück verdeutlicht, wie weit wir bei diesen Faktoren gekommen sind und wie wichtig permanente Weiterentwicklungen sind, um die wachsenden Anforderungen von Unternehmen zu erfüllen.
Kurzer Blick zurück
Die Idee, Daten durch das Anfertigen einer Kopie an einem entfernten Ort zu schützen, hat eine lange und reiche Geschichte. Die Grundlage ist die Erstellung von Sicherungskopien, die dann an einen entfernten Standort transportiert wurden. Die Sicherungskopie konnte zur Wiederherstellung der Daten verwendet werden, falls die Primärdaten jemals kompromittiert wurden. Jahrzehntelang waren ungeschützte Platten das Medium der Wahl für primäre Unternehmensdaten, während Bänder als Speichermedium der Wahl für Sicherungskopien fungierten. In dieser guten, alten Zeit wurde das RTO, also die Zeit, die vom Zeitpunkt des Schadens bis zur vollständigen Wiederherstellung der Systeme vergehen darf, gewöhnlich in Tagen berechnet. Das RPO legt fest, wie viel Datenverlust ein Unternehmen gegebenenfalls hinzunehmen bereit ist. Entsprechend wird der Zeitraum festgelegt, in dem Sicherungskopien erstellt werden. Oftmals wurde auch das RPO in Tagen definiert. In der Praxis bedeutete dies, dass im Falle eines Schadens häufig die Daten von Tagen verloren gingen.
Heutzutage kann kein Unternehmen sich RPO oder RTO im Maßstab von Tagen erlauben. In einer perfekten Welt sollte das RTO gleich Null sein – sofortiger Dauerbetrieb nach einem Schaden, ohne dass menschliches Eingreifen erforderlich ist. Das perfekte RPO liegt ebenfalls bei Null – kein Datenverlust trotz eines Problems. Doch wie realistisch ist das?
Meilensteine
Tatsächlich sind sowohl ein RTO von Null als auch ein RPO von Null heute realistisch. Dass dem so ist, haben wir einer Reihe wichtiger Entwicklungen zu verdanken, die verschiedene Vorreiter der Storage-Branche beigetragen haben.
Bereits 1994 führte die Digital Equipment Corporation (DEC) die OpenVMS Multi-Datacenter Facility (MDF) ein, die später in Business Recovery Server (BRS) umbenannt wurde. Dabei handelt es sich um eine entfernungsabhängige synchrone Implementierung von OpenVMS-Clustern. Sie ermöglicht es einem Rechenzentrum, den Betrieb aufrechtzuerhalten, wenn das andere ausfiel, und bot die weltweit erste Datenschutzlösung mit Null RPO und nahezu Null RTO (bei einem maximalen Abstand der Rechenzentren von ca. 40 Kilometern). MDF war serverbasiert und erforderte, dass die gesamte Hardware und Software von DEC stammte.
Ebenfalls bereits 1994 führte die EMC Corporation die Symmetrix Remote Data Facility (SRDF) ein, die weltweit erste speicherbasierte synchrone Datenreplikationslösung auf Abstand, die in der Lage war, für mehrere Server ein RPO von Null bei einem RTO von nahezu Null zu gewährleisten. Im Laufe des nächsten Jahrzehnts folgten alle großen Speicheranbieter dem Beispiel von EMC und führten ihre eigenen Replikationsprodukte ein.
2010 lieferte EMC Corporation mit VPLEX eine weitere Innovation, die weltweit erste Technologie, die endlich einen Datenschutz mit RPO Null und RTO Null innerhalb bestimmter Entfernungen bietet. Ein Großteil der technischen Grundlage von VPLEX stammte aus der Übernahme von Yotta Yotta durch EMC im Jahr 2008.
2017 war Pure Storage das erste Unternehmen neben Dell EMC, das mit ActiveCluster eine synchrone Replikationslösung mit Null RPO und Null TRO auf den Markt brachte. 2019 folgte Infinidat mit Active-Active-Replikation für seine InfiniBox-Stysteme, ebenfalls eine synchrone Replikationslösung mit Null RPO und Null RTO bietet, allerdings weniger kostspielig und komplex als die Angebote von Dell EMC-Angebote und besser skalierbar als dien Lösung von Pure.
In diesem Jahr schließlich hat Infinidat seine Lösung zur asynchronen Replikation mit niedrigem RPO (4 Sekunden Zykluszeit) und Active-Active Replikation kombiniert. Hierdurch stehen nun Optionen für optimales RPO und RTO in Replikationslösungen mit drei oder mehr Standorten zur Verfügung.
Stand der Technik
Bei der genannten asynchronen Replikation der beiden synchronen Systeme zu einem dritten (oder vierten) Standort kann ein RPO im einstelligen Sekundenbereich gewährleistet werden. Dies ist derzeit das Optimum des Machbaren. Die meisten Infrastrukturen mit asynchroner Replikation über große Abstände erreichen bestenfalls ein RPO im Minutenbereich. Wir haben definitiv einen langen Weg zurückgelegt von den Tagen, in denen sich Unternehmen mit Sicherungskopien auf Bändern und RPO und RTO im Bereich von Tagen zufriedengegeben haben. In der heutigen Zeit sind ist viele Anwendungen nicht nur ein RPO von Tagen nicht mehr akzeptabel, sondern auch ein RPO von Minuten ist häufig nicht mehr gut genug. Genau einen solchen weisen allerdings Infrastrukturen auf, die einen RPO lediglich zwischen synchronen Rechenzentren bieten und nicht auch für die asynchronen.
Hans Hallitzky, Sales Manager DACH bei INFINIDAT, www.infinidat.com