Ein Notfallhandbuch ist ein zentrales Instrument zur Gewährleistung der Betriebskontinuität und zum Management von Krisensituationen.
Es dient als umfassende Referenz, die darauf ausgerichtet ist, Organisationen durch den Prozess der Wiederherstellung und Aufrechterhaltung von Geschäftsabläufen zu leiten, sollte ein
unvorhergesehenes Ereignis eintreten.
In seiner Kernfunktion bietet das Handbuch eine strukturierte Vorgehensweise für die Erkennung, Bewertung und Behebung von Notfallsituationen, um die Auswirkungen auf die Geschäftstätigkeit so
gering wie möglich zu halten.
Im Risikomanagement und der Notfallplanung ist eine klare Unterscheidung zwischen Betriebsstörungen, Notfällen und Katastrophen entscheidend, um angemessene Reaktionsstrategien entwickeln zu
können. Jeder dieser Begriffe beschreibt ein unterschiedliches Ausmaß und eine unterschiedliche Art von Störung, die spezifische Maßnahmen erfordert.
Betriebsstörungen sind Ereignisse, die den normalen Betriebsablauf durch den Ausfall einzelner Komponenten, Softwarefehler oder Fehler im Systemmanagement stören. Diese Ereignisse sind quasi die
„täglichen Katastrophen“, die in der Regel nur einzelne Geschäftsprozesse betreffen und mit vorhandenen Betriebsmitteln sowie Standardverfahren behoben werden können. Sie sind charakterisiert
durch ihre direkte Auswirkung auf spezifische Betriebsfunktionen und die Möglichkeit einer zeitnahen Lösung.
Betriebsstörungen werden in der Regel intern gemanagt und erfordern keine außergewöhnlichen Maßnahmen zur Behebung. Sollte eine Störung jedoch nicht innerhalb einer festgelegten Zeit behoben
werden können, besteht das Risiko einer Eskalation zum Notfall.
Ein Notfall ist eine schwerwiegendere Störung, die zum Ausfall eines gesamten Rechenzentrums oder eines wesentlichen Betriebsbereichs führen kann. Diese Art von Störung hat das Potenzial, den
Großteil der Geschäftsfunktionen zu beeinträchtigen und das Weiterbestehen des Unternehmens zu gefährden, insbesondere wenn keine vorbeugenden Maßnahmen für den Wiederanlauf existieren.
Notfälle erfordern umfangreiche Reaktionspläne und oft die Aktivierung spezieller Notfallteams. Sie können eine erhebliche Umstrukturierung der Betriebsabläufe oder den temporären Wechsel zu
alternativen Betriebsstätten erforderlich machen.
Katastrophen sind Ereignisse von noch größerem Ausmaß, die Gebiete weit über das Unternehmen hinaus betreffen, wie ganze Stadtteile, Städte oder Regionen. Die Auswirkungen sind so umfangreich und
gravierend, dass die Wiederherstellung des normalen Unternehmensbetriebs in den Hintergrund tritt gegenüber sofortigen Rettungs- und Wiederherstellungsmaßnahmen auf kommunaler oder nationaler
Ebene.
In solchen Fällen liegt der Fokus auf der Sicherheit der Mitarbeiter und der Gemeinschaft, und es werden oft externe Ressourcen und staatliche Hilfe benötigt, um mit den Folgen umzugehen.
Nachchstehend liegt der Schwerpunkt ausschließlich auf der Betrachtung von Notfällen. Dies umfasst die Entwicklung von Strategien zur Minimierung der Auswirkungen solcher Ereignisse auf das
Unternehmen und zur Sicherstellung einer schnellen Wiederherstellung der operativen Kapazitäten.
Das Notfallhandbuch ist ein essenzieller Bestandteil des Risikomanagements und der Notfallvorsorge einer Organisation. Es gewährleistet, dass die Organisation auf den Ausfall kritischer
Komponenten ihrer Betriebsführung vorbereitet ist. Im Fokus stehen dabei die zeitkritischen Geschäftsprozesse, deren kontinuierliche Funktion für die Aufrechterhaltung des Geschäftsbetriebs von
zentraler Bedeutung ist. Die Notfallplanung deckt verschiedene Szenarien ab, darunter den Ausfall von Personal, Gebäuden und deren Infrastrukturen, IT-Anwendungen sowie externe Dienstleistungen.
Im Kern des Handbuches steht der Gedanke, dass jeder Prozess und jede Ressource durch spezifische Recovery Time Objectives (RTOs) geschützt werden muss, die in der Business Impact Analyse
definiert sind. Diese RTOs geben vor, in welcher Zeit die jeweiligen Prozesse nach einem Ausfall wieder aufgenommen werden müssen, um kritische Geschäftsunterbrechungen zu vermeiden.
Für die verschiedenen Ausfallszenarien werden im Notfallhandbuch detaillierte Maßnahmenpläne formuliert, die die Wiederherstellung des Geschäftsbetriebs sicherstellen sollen:
- Sofortmaßnahmen
Diese Maßnahmen werden unmittelbar nach Eintritt eines Notfalls ergriffen, um die Auswirkungen zu minimieren und die wichtigsten Geschäftsprozesse aufrechtzuerhalten.
- Vorbereitung des Notbetriebs
Hier werden die Schritte definiert, die erforderlich sind, um den Betrieb unter Notbedingungen fortzusetzen. Dies umfasst die Aktivierung alternativer Betriebsstätten, Kommunikationspläne und
die Zuweisung von Ersatzressourcen.
- Durchführung des Notbetriebs
In diesem Abschnitt wird beschrieben, wie der Geschäftsbetrieb unter den eingeschränkten Bedingungen des Notbetriebs funktionieren wird. Hierzu gehören alternative Arbeitsmethoden, Änderungen
in der Arbeitsverteilung und Priorisierung von Aufgaben.
- Rückführung in den Normalbetrieb
Schließlich werden Strategien entwickelt, die es ermöglichen, nach der Stabilisierung der Situation die Geschäftsprozesse wieder in den regulären Betrieb überzuführen. Dazu gehört die
sorgfältige Planung der Rückkehr zu den Standardbetriebsprozessen und -standorten sowie die Überprüfung und das Lernen aus dem Notfall.
Ein Notfall im Unternehmenskontext tritt ein, wenn unvorhergesehene Ereignisse die Fortführung betriebswichtiger Abläufe stören oder gänzlich unterbrechen. Dies kann auf vielfältige Ursachen
zurückzuführen sein, wie technische Defekte, Naturkatastrophen oder auch menschliches Versagen. Die Herausforderung besteht darin, dass die betroffenen Geschäftsprozesse oder Ressourcen innerhalb
einer definierten Zeit – der maximal tolerierbaren Ausfallzeit nicht in ihrem regulären Modus wiederhergestellt werden können. Diese Zeitspanne bildet die kritische Grenze, bis zu der das
Unternehmen einen Ausfall ohne signifikante Schäden ertragen kann.
Zur Bewältigung solcher Krisensituationen werden Notfallpläne entwickelt, die detaillierte Vorgehensweisen für den Wiederanlauf in einen Notbetrieb umfassen. Diese Pläne konzentrieren sich
darauf, die betriebliche Kontinuität mit minimalen Ressourcen aufrechtzuerhalten, bis eine vollständige Wiederherstellung möglich ist. Recovery Pläne ergänzen diese Strategie, indem sie konkrete
Schritte zur Wiederherstellung der betroffenen Geschäftsprozesse und Ressourcen aufzeigen. Sie beinhalten in der Regel Prioritäten, Verantwortlichkeiten, Kommunikationswege und Abläufe zur
effizienten Reaktion auf die Krise.
Die Bestimmung der Wiederanlaufpriorität von Geschäftsprozessen nach einem Notfall basiert auf den Ergebnissen der Business Impact Analyse, die die maximal tolerierbaren Ausfallzeiten und die
Notwendigkeit der Aufrechterhaltung bestimmter Geschäftsprozesse bewertet. Entscheidend ist, dass die für die Ausführung zeitkritischer Prozesse erforderlichen Ressourcen innerhalb dieser
definierten Zeitspannen wieder zur Verfügung stehen. Die entsprechenden Wiederanlaufzeiten für diese Ressourcen werden als Recovery Time Objectives innerhalb des Notfallplans festgelegt.
Im Falle eines Notbetriebs, in dem Ressourcen möglicherweise begrenzt sind, wird der Fokus auf die Aufrechterhaltung der als zeitkritisch identifizierten Prozesse gelegt. Andere Prozesse, die
weniger zeitkritisch sind oder deren Ausfall keine unmittelbaren schwerwiegenden Auswirkungen hat, können für die Dauer des Notbetriebs vorübergehend ausgesetzt oder zurückgestellt werden. Diese
Entscheidung basiert auf einer sorgfältigen Abwägung der Bedeutung jedes Prozesses für die Geschäftskontinuität und die Fähigkeit des Unternehmens, seine grundlegenden Dienstleistungen und
Funktionen in einer Krisensituation fortzuführen.
Prinzipien, die für eine gut durchdachte Notfallplanung unerlässlich sind:
- Gesamtheitliche Betrachtung
Jedes Notfallhandbuch muss eine umfassende Perspektive einnehmen, die technologische, organisatorische und operationale Aspekte berücksichtigt und sicherstellt, dass alle Facetten der
Betriebskontinuität abgedeckt sind.
- Integration
Sicherheitsmaßnahmen und Notfallpläne müssen mit bestehenden Unternehmensprozessen und -richtlinien sowie mit externen Partnern und Dienstleistern nahtlos integriert werden, um Konsistenz und
Effektivität zu gewährleisten.
- Wirtschaftlichkeit
Die Kosten für Notfallmaßnahmen müssen im Verhältnis zum Wert der zu schützenden Informationen und Systeme stehen.
- Aktualität
Regelmäßige Überprüfungen und Aktualisierungen des Handbuchs sind entscheidend, um sicherzustellen, dass die enthaltenen Informationen und Verfahren den neuesten Risiken und Entwicklungen
Rechnung tragen.
- Anpassung an den Stand der Technik
Die im Handbuch beschriebenen Verfahren sollten immer den aktuellen Stand der Technik widerspiegeln und besten Praktiken folgen.
- Schnelle Erkennung und Reaktion
Verfahren zur Überwachung und Meldung von Sicherheitsvorfällen müssen etabliert werden, um auf Vorfälle zeitnah reagieren zu können.
- Überprüfbarkeit und Dokumentation
Alle Aktionen und Entscheidungen müssen dokumentiert werden, um Transparenz und Nachvollziehbarkeit zu gewährleisten.
- Klare Verantwortlichkeiten
Das Handbuch muss deutlich definieren, wer in Krisensituationen für was verantwortlich ist, um effektive und schnelle Entscheidungen zu ermöglichen.
Im Kontext des Notfallmanagements ist es essenziell, zwischen Betriebsstörungen, Notfällen und Katastrophen zu differenzieren, da jede Kategorie unterschiedliche Reaktionen und Maßnahmen
erfordert. Ein Notfallhandbuch sollte daher die Definitionen und Reaktionspläne für diese drei Ereignisarten klar darlegen:
- Definition
Betriebsstörungen sind Störungen des DV-Betriebs durch den Ausfall einzelner Komponenten, Softwarefehler oder Fehler im System-Management. Sie gelten als „die täglichen Katastrophen“ und
betreffen meist nur einzelne Geschäftsprozesse.
- Reaktionsplan
Betriebsstörungen sollten normalerweise mit vorhandenen Betriebsmitteln und Standardabläufen behoben werden können. Im Notfallhandbuch müssen Prozesse und Verantwortlichkeiten für die
Behebung solcher Störungen definiert werden.
- Eskalationskriterium
Wenn eine Betriebsstörung nicht innerhalb einer definierten Wiederanlaufzeit behoben werden kann, kann sie sich zu einem Notfall ausweiten
- Definition
Ein Notfall bezeichnet eine erhebliche Störung, die den Ausfall des gesamten Rechenzentrums oder eines zentralen Gebäudes zur Folge hat. Dies kann die Ausführung eines Großteils der
Geschäftsfunktionen verhindern.
- Reaktionsplan
Notfälle erfordern außerordentliche Maßnahmen und oft den Einsatz vordefinierter Notfall- und Wiederanlaufpläne. Das Handbuch muss ein klares Prozedere für die Wiederherstellung der
Geschäftsaktivitäten an einem Ausweichstandort oder durch alternative Mittel beschreiben.
- Vorsorgliche Maßnahmen
Präventive Maßnahmen sind entscheidend, um sicherzustellen, dass das Unternehmen fortbestehen kann. Dazu gehört die Planung von Ausweichstandorten und die Implementierung von
Redundanzmechanismen.
- Definition
Katastrophen sind schwerwiegende Ereignisse mit umfassenden Auswirkungen auf ganze Regionen. Die Schäden überschreiten die Kapazitäten eines einzelnen Unternehmens und erfordern eine
übergeordnete Koordination.
- Reaktionsplan
In solchen Fällen müssen Unternehmen oftmals mit Behörden und Organisationen auf regionaler oder nationaler Ebene zusammenarbeiten. Die Prioritäten liegen dabei nicht allein auf der
Wiederherstellung des Unternehmens, sondern auch auf der Sicherheit der Mitarbeiter und der Öffentlichkeit.
- Vorbereitung
Obwohl das Notfallhandbuch sich hauptsächlich auf Notfälle konzentriert, sollten auch generelle Richtlinien für die Reaktion auf Katastrophen bereitgestellt werden, unter Einbeziehung von
Katastrophenschutz- und Rettungsplänen.
Das Notfallhandbuch muss sicherstellen, dass für jede dieser Kategorien spezifische, detaillierte und durchführbare Pläne entwickelt wurden. Diese Pläne sollten nicht nur die unmittelbare
Reaktion auf den Vorfall umfassen, sondern auch langfristige Strategien zur Wiederherstellung und zum Schutz der Geschäftskontinuität. Dabei ist es wichtig, die Verantwortlichkeiten und
Kommunikationswege klar zu definieren, um eine schnelle und koordinierte Reaktion zu ermöglichen.
Die Gewährleistung der Geschäftskontinuität in Notfallsituationen ist eine kritische Verantwortung des Notfallmanagements. Bei Ausfall essenzieller Funktionen oder Ressourcen ist der
Notfallmanager verpflichtet, schnell und effektiv zu handeln, um die Aufrechterhaltung der zeitkritischen Geschäftsprozesse zu sichern.
Grundlagen des Notbetriebs
- Die Entscheidung über die Notbesetzung fällt in den Verantwortungsbereich des Notfallmanagers, der die betriebliche Kontinuität unter eingeschränkten Bedingungen sicherstellt.
- Alternativstandorte und flexible Arbeitszeiten können etabliert werden, um die Mindestanforderungen der Geschäftstätigkeit zu erfüllen.
- Für die Planung und Realisierung der Notbesetzung wird das sogenannte "Worst-Case-Szenario" angenommen, um auf die ungünstigsten Bedingungen vorbereitet zu sein.
Ermittlung der Notfallbesetzung
- Eine sorgfältige Analyse bestimmt die minimale Anzahl an Mitarbeitenden, die benötigt wird, um die kritischsten Geschäftsabläufe fortzuführen.
- Rollen und Verantwortlichkeiten werden klar definiert, um sicherzustellen, dass jede Person im Notfallteam genau weiß, was zu tun ist.
- Arbeitsplätze und Ressourcen werden im Voraus festgelegt, um eine effiziente Reaktion auf den Notfall zu ermöglichen.
Kommunikation und Koordination
- Der Notfallmanager etabliert Kommunikationspläne, um sicherzustellen, dass alle Mitarbeiter schnell und eindeutig über den Eintritt eines Notfalls informiert werden.
- Es werden Abstimmungen mit angrenzenden Geschäftseinheiten vorgenommen, um eine übergreifende Koordination im Notbetrieb zu gewährleisten.
- Ein regelmäßiges Reporting an das Krisenmanagement-Team ist erforderlich, um eine zentrale Übersicht über den Status der Notfallsituation zu behalten.
Zurück zum Normalbetrieb
- Sobald die normale Betriebsfähigkeit wiederhergestellt werden kann, leitet der Notfallmanager die Schritte zur Rückkehr zum regulären Geschäftsbetrieb ein.
- Die im Notbetrieb gewonnenen Erfahrungen und Daten werden analysiert, um den Prozess für zukünftige Ereignisse zu optimieren und zu verbessern.
Die Identifizierung der für den Notbetrieb wesentlichen Rollen und Funktionen beinhaltet die Analyse, welche Positionen zwingend besetzt sein müssen, um die kritischen Geschäftsprozesse
aufrechtzuerhalten.
Grundlegende Anforderungen
- Für jeden kritischen Prozess muss ein Verantwortlicher bestimmt werden, der im Notfall die jeweilige Rolle übernimmt.
- Die Definition der Rollen beinhaltet auch die Zuweisung von Stellvertretern, die bei Bedarf einspringen können.
- Zudem ist eine detaillierte Auflistung der erforderlichen Arbeitsplätze und deren technische Ausstattung notwendig, um die Ausführung der kritischen Prozesse zu garantieren.
Ermittlung des Bedarfs an Notfallarbeitsplätzen
- Die Anzahl der benötigten Notfallarbeitsplätze muss im Vorfeld bestimmt und vorbereitet werden.
- Sollten Arbeitsplätze an der Hauptlokation ausfallen, muss eine ausreichende Anzahl von Arbeitsplätzen an einer alternativen Lokation verfügbar sein.
- Bei einem teilweisen oder vollständigen Ausfall des Standorts sollte die Möglichkeit bestehen, dass Mitarbeiter ihre Tätigkeiten remote, also von einem anderen Ort oder von zu Hause,
ausführen können.
Remote-Arbeitsstrategien
- Die technische Infrastruktur für Remote-Arbeitsplätze muss so eingerichtet sein, dass sie im Falle eines Notfalls schnell aktiviert werden kann.
- Es ist wichtig, dass die Mitarbeiter im Umgang mit Remote-Arbeitsplatzlösungen geschult werden und regelmäßige Tests durchgeführt werden.
- Bei der Auswahl der Remote-Arbeitsplatzlösungen sollten Sicherheitsaspekte und Datenschutzbeschränkungen berücksichtigt werden, um die Integrität und Vertraulichkeit von Daten zu wahren.
Planung und Training
- Um die effektive Funktion des Notbetriebs zu gewährleisten, ist eine gründliche Planung und regelmäßiges Training der Mitarbeiter unerlässlich.
- Sowohl die Verantwortlichen für die Rollen und Funktionen als auch die Mitarbeiter, die im Notbetrieb arbeiten, sollten in den Notfallplänen und in der Handhabung der Ausweicharbeitsplätze
gut unterwiesen sein.
Festlegung der Rollen und Verantwortlichkeiten
- Alle Rollen innerhalb des Notfallteams müssen klar definiert sein, um sicherzustellen, dass im Notfall keine Verwirrung hinsichtlich der Zuständigkeiten entsteht.
- Jede Rolle sollte eine klare Beschreibung ihrer Aufgaben und Verantwortungsbereiche haben, sowie der besonderen Befugnisse, die im Notfall gültig sind.
Erweiterung der Befugnisse
- Bestimmte Rollen können im Falle eines Notfalls erweiterte Befugnisse erhalten, um schnellere Entscheidungen treffen zu können.
- Dies kann die Genehmigung von Ausgaben, die Freigabe von Ressourcen oder die Änderung von Betriebsabläufen umfassen, um nur einige Beispiele zu nennen.
Kommunikation und Dokumentation
- Die besonderen Befugnisse im Notfall müssen allen Beteiligten klar kommuniziert werden.
- Zusätzliche Kompetenzen und die damit verbundenen Entscheidungen müssen dokumentiert werden, um Transparenz und Nachvollziehbarkeit zu gewährleisten.0
Gesetzliche Rahmenbedingungen
- Alle erweiterten Befugnisse müssen im Einklang mit geltenden Gesetzen und internen Richtlinien stehen.
- Insbesondere muss die Funktionstrennung beachtet werden, um Interessenkonflikte und Compliance-Verstöße zu vermeiden.
Beispielhafte Rollen im Notfallteam
- Notfallmanager
Koordination des Krisenteams und Übernahme der Leitung im Notfall.
- IT-Sicherheitsbeauftragter
Gewährleistung der IT-Sicherheit und schnelle Behebung von IT-Problemen.
- Kommunikationsverantwortlicher
Steuerung der internen und externen Kommunikation.
- Logistikkoordinator
Sicherstellung der Ressourcenverteilung und Infrastrukturmanagement.
Im Notfall dient der Notfallmanager Risk als zentraler Anlaufpunkt für alle Mitarbeitenden seines Bereichs und fungiert als primäre Informationsquelle. Im Falle eines Notfalls hat er die Aufgabe,
alle relevanten Mitarbeitenden der Organisationseinheit, einschließlich jener an dezentralen Standorten, über die internen Kommunikationswege oder, falls notwendig, über private Kontaktadressen
zu alarmieren
Der Notfallmanager Risk koordiniert zudem mit angrenzenden Abteilungen, um sicherzustellen, dass alle notwendigen Schritte im Einklang mit den übergeordneten Strategien und Prozessen stehen. Er
sorgt für die Abstimmung mit dem Finanzbereich hinsichtlich der Anforderungen an die Eigenmittel und teilt den Eintritt in den Notbetrieb mit.
Strategien
- Stellvertreterregelungen
Für jede kritische Position sollten im Voraus Stellvertreter bestimmt werden, die in der Lage sind, die wesentlichen Aufgaben zu übernehmen. Dies beinhaltet eine entsprechende Einarbeitung
und regelmäßiges Training.
- Flexibles Personalmanagement
Ein Pool von Mitarbeitern, die verschiedene Rollen übernehmen können, schafft Flexibilität und verringert die Abhängigkeit von Einzelpersonen.
- Externes Personal
Im Falle eines drastischen Personalausfalls kann die kurzfristige Akquise von qualifiziertem Personal über Zeitarbeitsfirmen oder Dienstleister eine Lösung sein.
Maßnahmen im Notfall
- Sofortige Identifizierung der betroffenen Rollen
Feststellen, welche Schlüsselpositionen unbesetzt sind und wie kritisch diese für den Betriebsablauf sind.
- Aktivierung des Stellvertreterplans
Unmittelbares Hochfahren des Stellvertretersystems, um sicherzustellen, dass die kritischen Funktionen weiterhin besetzt sind.
- Kommunikation und Koordination
Informieren aller relevanten Stakeholder über den Notfall und die ergriffenen Maßnahmen, um Transparenz zu gewährleisten und zusätzliche Unterstützung zu organisieren.
- Anpassung der Arbeitslast
Priorisierung und ggf. Verschiebung von weniger kritischen Aufgaben, um die verfügbaren Ressourcen auf die wesentlichen Funktionen zu konzentrieren.
- Überprüfung und Anpassung von Arbeitsabläufen
Anpassung der Prozesse, um den veränderten Personalbestand widerzuspiegeln, ohne die Qualität der Arbeit zu beeinträchtigen.
Maßnahmen zur Rückkehr in den Normalbetrieb
- Reintegration des Personals
Wenn das reguläre Personal wieder verfügbar ist, sollte eine geordnete Rückkehr zu den normalen Abläufen erfolgen.
- Nachbereitung und Analyse
Nach dem Notfall sollte eine Analyse durchgeführt werden, um zu bewerten, was gut funktioniert hat und wo Verbesserungen möglich sind.
- Dokumentation und Feedback
Die Erfahrungen aus dem Notfall sollten dokumentiert und genutzt werden, um den BCP zu verbessern und das Personal für zukünftige Vorfälle besser vorzubereiten.
Strategien
- Ausweichstandorte
Vorbereitete Ausweichstandorte, die schnell aktiviert werden können, sind essenziell. Diese Standorte sollten über notwendige Arbeitsmittel und Zugang zu kritischen IT-Systemen
verfügen.
- Remote-Arbeitsmöglichkeiten
Flexible Arbeitsregelungen wie Homeoffice oder remote zugängliche Arbeitsplätze für Mitarbeiter, um die Arbeit auch bei Gebäudeausfall fortsetzen zu können.
- Kritische Infrastrukturen sichern
Nutzung von unterbrechungsfreien Stromversorgungen (USVs) und Generatoren für kritische Systeme sowie Sicherstellung alternativer Kommunikationswege.
Maßnahmen im Notfall
- Evakuierungspläne
Im Falle einer Notsituation sollten klare Evakuierungspläne vorhanden sein, um die Sicherheit des Personals zu gewährleisten.
- Aktivierung von Notfallteams
Einsatz von Notfallteams, die darauf trainiert sind, schnell zu handeln und den Betrieb an alternativen Standorten aufzunehmen.
- Notfallkommunikation
Sicherstellen einer zuverlässigen Informationsweitergabe an Mitarbeiter, Kunden und Partner über den Status des Notfalls und die nächsten Schritte.
Maßnahmen zur Rückkehr in den Normalbetrieb
- Überprüfung und Freigabe des Gebäudes
Bevor der Betrieb wieder aufgenommen wird, muss das Gebäude auf Sicherheit geprüft und freigegeben werden.
- Restaurierung der Infrastruktur
Reparatur und Wiederherstellung aller betroffenen Gebäudeteile und Infrastrukturen, bevor die Mitarbeiter zurückkehren.
- Nachbereitung
Analyse des Notfallmanagements und Bewertung der Ausweichstrategien, um künftige Abläufe zu verbessern.
- Wiederaufnahme des Betriebs
Schrittweise Rückkehr zum normalen Betrieb unter Berücksichtigung aller Sicherheits- und Gesundheitsaspekte.
Strategien
- Disaster Recovery Plan
Entwicklung und regelmäßige Aktualisierung eines Disaster Recovery Plans, der Schritte für die Wiederherstellung von IT-Services und Anwendungen im Notfall beinhaltet.
- Redundante Systeme
Implementierung redundanter Systeme und Datenbanken, die bei Ausfall der primären IT-Infrastruktur aktiviert werden können.
- Cloud-Dienste
Nutzung von Cloud-basierten Services für kritische Anwendungen, um von deren integrierter Hochverfügbarkeit und geografischer Redundanz zu profitieren.
Maßnahmen im Notfall
- Aktivierung des Disaster Recovery Plans
Sofortige Aktivierung des vorab erstellten Disaster Recovery Plans, um die IT-Services und Anwendungen wiederherzustellen.
- Schalten auf Ersatzsysteme
Umschalten auf vorbereitete Ersatzsysteme, um die Kerngeschäftsprozesse aufrechtzuerhalten.
- Notkommunikation
Einrichtung einer Notkommunikation, um Mitarbeitenden und Kunden den Ausfall und die erwartete Wiederherstellungszeit mitzuteilen.
Maßnahmen zur Rückführung in den Normalbetrieb
- Schrittweise Wiederherstellung
Schrittweise Wiederherstellung und Integration der IT-Services und Anwendungen, um Stabilität und Funktionalität zu gewährleisten.
- Überprüfung der Datenintegrität
Sicherstellung, dass alle wiederhergestellten Daten und Anwendungen vor der vollständigen Inbetriebnahme auf Integrität und Vollständigkeit überprüft werden.
- Nachbereitung und Analyse
Nach dem Notfall eine gründliche Untersuchung durchführen, um die Ursachen zu verstehen und die Strategien und Maßnahmen für zukünftige Ausfallsicherheit zu verbessern.
Strategien
- Mehrere Dienstleister
Zusammenarbeit mit mehreren Dienstleistern für kritische Services, um das Risiko einer kompletten Unterbrechung zu minimieren.
- Interne Redundanzen schaffen
Aufbau interner Kapazitäten, um Dienstleistungen notfalls selbst erbringen zu können, falls externe Anbieter ausfallen.
- Dienstleister-Audits
Regelmäßige Überprüfung der Dienstleister hinsichtlich ihrer Notfall- und Wiederherstellungspläne, um die Zuverlässigkeit im Notfall sicherzustellen.
Maßnahmen im Notfall
- Aktivierung alternativer Lieferanten:
Vorab vereinbarte Verträge mit alternativen Lieferanten, die im Notfall aktiviert werden können, um die Dienstleistung fortzuführen.
- Notfallkommunikation
Schnelle Kommunikation mit dem Dienstleister, um das Ausmaß des Ausfalls zu verstehen und zusammen an einer Lösung zu arbeiten.
- Eigeninitiative ergreifen
Wenn möglich, temporäre interne Maßnahmen ergreifen, um die kritischen Dienstleistungen selbst bereitzustellen.
Maßnahmen zur Rückführung in den Normalbetrieb
- Koordinierte Wiederherstellung
Zusammenarbeit mit dem Dienstleister, um die Wiederherstellung der Dienstleistungen zu planen und umzusetzen.
- Prüfung der Servicequalität
Bevor die normalen Betriebsabläufe wieder aufgenommen werden, muss sichergestellt werden, dass die Dienstleistungen den erforderlichen Qualitätsstandards entsprechen.
- Evaluation und Anpassung
Überprüfung der Notfallmaßnahmen und Anpassung der Strategien für Dienstleistungen, um zukünftige Ausfälle zu verhindern.
Die Wiederanlaufanforderungen sind entscheidend für die Planung und Umsetzung von Maßnahmen zur Wiederherstellung von Geschäftsprozessen und IT-Systemen nach einem Notfall. Sie definieren die
maximal tolerierbaren Ausfallzeiten und Datenverluste, um den Fortbestand des Unternehmens zu sichern.
Eine derartige Tabelle sollte im Notfallhandbuch enthalten sein, um sicherzustellen, dass alle Beteiligten wissen, wen sie in verschiedenen Notfallsituationen kontaktieren müssen.
Wiederanlaufanforderungen setzen sich aus zwei Hauptkomponenten zusammen: der Wiederherstellungszeit (Recovery Time Objective, RTO) und der Datenverlustzeit (Recovery Point Objective, RPO).
Wiederherstellungszeit (RTO):
- Für Geschäftsfunktionen: Die Zeitspanne zwischen dem Eintritt des Notfalls und der Wiederverfügbarkeit der ersten Arbeitsplätze sowie der benötigten Arbeitsressourcen, was den Beginn des
Notbetriebs markiert.
- Für IT-Anwendungen: Die Zeitspanne zwischen dem Eintritt des Notfalls und der Wiederverfügbarkeit der Anwendung für Benutzer oder für die Kommunikation mit anderen Anwendungen.
Datenverlustzeit (RPO):
- Für Geschäftsfunktionen: Nicht anwendbar, da sich der RPO in der Regel auf Daten und IT-Systeme bezieht.
- Für IT-Anwendungen: Die Zeitspanne zwischen der letzten Datensicherung und dem Eintritt des Notfalls. Alle in diesem Zeitraum vorgenommenen Benutzereingaben oder Datenänderungen sind
unwiederbringlich verloren.
Zur effektiven Planung und Priorisierung von Wiederanlaufmaßnahmen ist die Einteilung in Wiederanlaufklassen hilfreich. Diese Klassen basieren auf den festgelegten RTOs und RPOs und
berücksichtigen die technischen und organisatorischen Möglichkeiten zur Wiederherstellung. Die Klassifizierung hilft dabei, die kritischsten Geschäftsfunktionen und IT-Anwendungen zu
identifizieren und entsprechende Vorsorge- und Wiederanlaufpläne zu entwickeln.
Beispielhafte Wiederanlaufklassen könnten sein:
- Klasse 1
Höchste Priorität mit RTOs von wenigen Minuten bis Stunden und minimalen RPOs, um kritische Geschäftsprozesse und IT-Systeme zu schützen.
- Klasse 2
Mittlere Priorität mit längeren RTOs und akzeptablen RPOs für wichtige, jedoch nicht kritische Funktionen.
- Klasse 3
Niedrige Priorität für Prozesse und Systeme, deren Ausfall oder Datenverlust für längere Zeit tolerierbar ist.
Die Festlegung dieser Klassen ermöglicht es Unternehmen, Ressourcen gezielt zuzuweisen und Notfall- sowie Wiederanlaufpläne entsprechend der kritischen Bedeutung von Geschäftsprozessen und
IT-Systemen zu priorisieren.
Die Kosten für die Einrichtung und den Unterhalt von Wiederanlauflösungen sind umso höher, je kürzer die geforderte Wiederherstellungs- und Datenverlustzeit ist. Nach einem Notfall entstehende
Kosten für den Wiederanlauf können durch eine Mehrkostenversicherung gedeckt werden.
Bei der Einstufung von Anwendungen und Geschäftsfunktionen in diese Klassen sind mehrere Bewertungskriterien zu berücksichtigen:
- Verletzung gesetzlicher oder anderweitiger Vorgaben.
- Der Punkt, ab dem erhebliche materielle oder immaterielle Schäden für das Unternehmen entstehen.
- Die Verfügbarkeit von Übergangs- und Ausweichverfahren, um Ausfälle zu kompensieren.
- Die Notwendigkeit, nicht getätigte Dateneingaben nachzuarbeiten und der mögliche Zeitraum hierfür.
- Die maximal tolerierbare Dauer des Datenverlusts.
Die Zuordnung von Geschäftsfunktionen zu den entsprechenden Wiederanlaufklassen ist ein kritischer Schritt, um die Prioritäten für die Wiederherstellungsstrategien festzulegen. Die Zuordnung
basiert auf der Wichtigkeit jeder Geschäftsfunktion und den Auswirkungen, die ein Ausfall auf das Gesamtunternehmen hätte. Hierbei wird jede Geschäftsfunktion nach verschiedenen Kriterien
bewertet und entsprechend einer Wiederanlaufklasse zugewiesen.
Die Zuordnung von IT-Anwendungen zu den Wiederanlaufklassen basiert auf der Bedeutung der Anwendungen für den Geschäftsbetrieb sowie auf der Datenkritikalität und dem Ausfallrisiko. Bei
backup-relevanten IT-Anwendungen ist die Fähigkeit zur Datenwiederherstellung nach einem Notfall ein Schlüsselfaktor.
Die Schadensbewertung ist ein wesentlicher Bestandteil des Risikomanagements und der Notfallplanung, besonders im Hinblick auf IT-Abhängigkeiten in modernen Unternehmen. Sie ermöglicht es, die
Investitionen in Wiederanlaufstrategien und -lösungen zu rechtfertigen, indem sie das Schadenspotenzial quantifiziert und qualifiziert. Dies ist entscheidend, um sicherzustellen, dass die
Vorsorgekosten in einem angemessenen Verhältnis zum potenziellen Schaden stehen.
Die Schwierigkeit, Schadensfolgen ausschließlich monetär zu bewerten, führt zur Einbeziehung von qualitativen Faktoren. Die vier Kategorien der Schadensbewertung – unternehmenskritisch,
erheblich, spürbar, unbedeutend – helfen dabei, die potenziellen Auswirkungen eines Notfalls auf verschiedene Aspekte des Unternehmens zu erfassen:
- Unternehmenskritisch
Bedroht die Existenz des Unternehmens, wobei neben finanziellen auch strategische und existenzielle Faktoren eine Rolle spielen.
- Erheblich
Beeinträchtigt wichtige Bestandteile der Wertschöpfungskette. Dies führt zu einem sichtbaren Einfluss auf finanzielle Kennzahlen und kann Kunden- und Auftragsverluste nach sich ziehen.
- Spürbar
Hat Einfluss auf das Kerngeschäft, aber die Auswirkungen können durch zusätzlichen organisatorischen Aufwand und außerplanmäßige Maßnahmen begrenzt werden, ohne dass Außenstehende deutliche
Auswirkungen spüren.
- Unbedeutend
Stört die Geschäftsabläufe minimal und hat keine Außenwirkungen. Der entstehende Mehraufwand kann innerhalb der regulären Arbeitszeiten bewältigt werden.
Für die Schadensbewertung ist auch zu beachten, dass Sachschäden in der Regel versichert sind und daher oft weniger Gewicht bei der Bewertung des Schadenspotenzials haben.