Wenn es um die Geschäftskontinuität geht, stechen zwei Schlüsselmetriken hervor: Recovery Point Objective (RPO) und Recovery Time Objective (RTO). Oft werden diese verwechselt oder die Diskussion dreht sich um RPO versus RTO.
Beide Metriken sind jedoch für die Entwicklung effektiver Datenschutzstrategien und die Minimierung von Unterbrechungen und Datenverlusten bei unvorhergesehenen Ereignissen unerlässlich. Angela Heindl-Schober von HYCU erläutert, was es damit auf sich hat.
Was ist Recovery Point Objective (RPO)?
Die Recovery Point Objective (RPO) definiert die maximal akzeptable Menge an Datenverlust, gemessen in Zeit. Sie legt fest, wie häufig Backups oder Datenreplikationen durchgeführt werden müssen, um sicherzustellen, dass der Datenverlust innerhalb akzeptabler Grenzen bleibt.
Angenommen, die RPO eines Unternehmens beträgt zwölf Stunden: Das bedeutet, dass die Backup- oder Replikationssysteme so konfiguriert sein müssen, dass sie Datenänderungen mindestens alle zwölf Stunden erfassen. Im Falle einer Unterbrechung können Daten von bis zu zwölf Stunden verlorengehen, aber nicht mehr.
Weitere wichtige Überlegungen zur RPO betreffen Geschäftsprozessanforderungen, Backup-Technologie und Kostenauswirkungen. Somit stellen sich die folgenden Fragen: Wie viele Daten kann das Unternehmen ohne nennenswerte Auswirkungen verlieren? Ermöglicht die aktuelle Lösung häufige Backups des gesamten Datenbestands? Werden häufigere Backups die Speicher- und Betriebskosten erhöhen?
Was ist Recovery Time Objective (RTO)?
Die Recovery Time Objective (RTO) ist die angestrebte Dauer für die Wiederherstellung von Systemen, Anwendungen oder Diensten nach einer Unterbrechung. Sie stellt die maximal tolerierbare Ausfallzeit dar, bevor ein Unternehmen inakzeptable Folgen zu spüren bekommt. RTOs sind oft schwer zu kontrollieren und die einzige Möglichkeit, die tatsächliche RTO zu ermitteln, besteht darin, eine Datenwiederherstellung durchzuführen und die dafür benötigte Zeit zu messen. Dies ist oft zeitaufwendig und gibt selten ein genaues Bild wieder, da es in einer kontrollierten Umgebung stattfindet und oft heruntergefahren wird, um negative Auswirkungen zu begrenzen.
Wenn die RTO eines Unternehmens vier Stunden beträgt, muss der Notfallwiederherstellungsplan sicherstellen, dass alle kritischen Systeme und Prozesse innerhalb von vier Stunden nach einem Ausfall wieder online sind.
Wichtige Überlegungen zur RTO betreffen die Systemkritikalität, Ausfallkosten, Reaktionsfähigkeit und Minimierung der RTO. Daraus ergeben sich Fragen wie: Wie wichtig ist die Anwendung oder das System für den laufenden Betrieb? Wie viel Umsatz oder Produktivität geht pro Stunde Ausfallzeit verloren? Unterstützen die Wiederherstellungslösungen und -prozesse die erforderliche Reaktionszeit? Unternehmen würden zudem gerne die niedrigstmögliche RTO für alle ihre Daten erreichen, was jedoch oft mit hohen Kosten verbunden ist. Aus diesem Grund stufen Unternehmen ihre Anwendungen häufig nach Kritikalität ein.
RPO und RTO im Zusammenhang mit der Geschäftskontinuität
Zunächst einmal geht es um die Minimierung von Datenverlust und Ausfallzeiten: Ungeplante Ausfälle können zu erheblichen Datenverlusten und längeren Betriebsunterbrechungen führen. Durch die Definition von RPO können Unternehmen sicherstellen, dass Backups häufig genug durchgeführt werden, um den geschäftlichen Anforderungen gerecht zu werden, und so Datenverluste minimieren. Zudem stellt eine klar definierte RTO sicher, dass kritische Systeme schnell wiederhergestellt werden, wodurch Ausfallzeiten und die damit verbundenen Kosten reduziert werden.
Ebenso wichtig sind Compliance und Vermeidung von Strafen. Viele Branchen unterliegen strengen Vorschriften, die spezifische Wiederherstellungsfunktionen vorschreiben. Beispielsweise verlangen der Finanzsektor und das Gesundheitswesen oft, dass Unternehmen strenge RPO- und RTO-Standards einhalten, um sensible Daten zu schützen. Die Nichteinhaltung kann zu hohen Geldstrafen, rechtlichen Verpflichtungen und dem Verlust von Zertifizierungen führen.
Die Aufrechterhaltung des Kundenvertrauens und des Markenrufs ist ein weiterer entscheidender Aspekt. In der heutigen Wettbewerbslandschaft erwarten Kunden unterbrechungsfreie Dienstleistungen und einen zuverlässigen Datenschutz. Längere Ausfallzeiten oder erhebliche Datenverluste können das Vertrauen untergraben und den Ruf einer Marke schädigen. Durch die Einhaltung von RPO- und RTO-Zielen zeigen Unternehmen ihren Kunden Zuverlässigkeit und Engagement und fördern so eine langfristige Kundenbindung.
Die Festlegung von RPO- und RTO-Zielen erfordert ein umfassendes Verständnis der Geschäftsprozesse. Dabei gilt es einige Faktoren zu bewerten. Dies beginnt mit den Auswirkungen auf den Umsatz. Dies erfordert es, die finanziellen Verluste, die durch Ausfallzeiten oder Datenverluste verursacht werden, zu quantifizieren. Ebenso wichtig ist es, zu verstehen, wie sich Unterbrechungen auf die Produktivität der Mitarbeiter auswirken. Längere Ausfälle oder Datenschutzverletzungen können zudem das Vertrauen der Kunden schädigen und den Ruf der Marke beeinträchtigen. Zur Einhaltung gesetzlicher Vorschriften müssen Unternehmen in vielen Branchen strenge Wiederherstellungs-Benchmarks erfüllen, denn die Nichteinhaltung kann zu rechtlichen Sanktionen oder Geldstrafen führen.
Einstufung von Anwendungen nach Kritikalität
Nicht alle Anwendungen und Systeme sind gleichermaßen wichtig. Eine Kategorisierung kann dazu beitragen, die Zuweisung von Workloads zu SLA-Stufen zu vereinfachen, die direkt mit den Geschäftsprioritäten übereinstimmen. Hierbei ist die Einteilung in die folgenden Application Tiers gängig:
- Tier 1 – Unternehmenskritische Anwendungen: Diese wirken sich direkt auf den Umsatz oder das Kundenerlebnis aus (z. B. Transaktionssysteme, CRM). Sie erfordern die strengsten RPO- und RTO-Ziele, z. B. eine RPO von zwei Stunden mit einer RTO von einer Stunde.
- Tier 2 – Wichtige Anwendungen: Diese unterstützen die Kerngeschäftsprozesse, haben jedoch weniger unmittelbare Auswirkungen (z. B. Tools für die interne Zusammenarbeit, Gehaltsabrechnung etc.). Sinnvoll ist hier beispielsweise eine RPO von zwölf Stunden mit einer RTO von sechs Stunden.
- Tier 3 – Weniger kritische Anwendungen: Diese haben bei kurzfristigen Ausfällen geringere Auswirkungen auf das Geschäft (z. B. interne Systeme, Reservierungs-Tools etc.).
Durch die Abstimmung ihres Notfallwiederherstellungsplans auf die Kritikalität der Anwendungen können Unternehmen die Kosten optimieren und sicherstellen, dass priorisierte Systeme die größte Aufmerksamkeit erhalten.
Resilienz stärken und Reputation schützen
Die Festlegung und Einhaltung angemessener RPO- und RTO-Ziele ist aus mehreren Gründen von entscheidender Bedeutung für die Geschäftskontinuität. Indem sie die beschriebenen Aspekte beachten, können sich Unternehmen besser auf potenzielle Störungen vorbereiten und sicherstellen, dass ihr Geschäftsbetrieb widerstandsfähig und ihre Reputation ungetrübt bleibt.