IT-Dokumentation - Der Blog

Ein aktuelles IT-Notfallhandbuch schützt Sie und Ihre Firma

Di, 8. Juni 2021

Laut dem Global Data Protection Index von Dell Technologies hatten im Jahr 2018 etwa 80% der Unternehmen in Deutschland mit massiven Störungen oder sogar größeren Ausfällen ihrer IT-Infrastruktur zu kämpfen. IT-Ausfälle sind also leider kein Einzelfall, sondern eher die Regel.

Wie also kann man sich und seine IT zuverlässig und zeitgemäß absichern?

Natürlich haben wir alle zahllose Schutzmaßnahmen gegen Angriffe, Stromausfälle etc. im Einsatz – Vorsicht ist eben besser als Nachsicht. Aber einen hundertprozentigen Schutz gegen IT-Ausfälle gibt es nicht. Oft reichen schon kleinste manuelle Fehler aus, um eine komplette IT-Umgebung lahmzulegen. Deshalb ist es grob fahrlässig für einen solchen Ernstfall nicht gewappnet zu sein.

Leider ist es aber in der Fläche so, dass viele Firmen nicht ausreichend auf einen Ausfall vorbereitet sind. So gibt es immer noch viele Unternehmen, die über gar kein oder ein nur unzureichendes Notfall-Management verfügen. Und das fängt schon beim IT-Notfallhandbuch an. Richtig gefährlich wird es nämlich, wenn ein IT-Notfallhandbuch zwar vorhanden, aber veraltet, unvollständig und/oder fehlerhaft ist. Dann verlässt sich der IT-Verantwortliche auf die Dokumentation, obwohl diese im Notfall aber unbrauchbar ist, weil zum Beispiel die dokumentierte Hardware bereits durch neue ersetzt wurde.

Was ist ein IT-Notfallhandbuch?

Ein IT-Notfallhandbuch enthält Handlungsanweisungen und Notfallmaßnahmen für Störungen in der IT. Diese Anweisungen sollen den Schaden für das Unternehmen möglichst gering halten, indem IT-Ausfälle schnellstmöglich behoben werden. Kurzgesagt wird in einem IT-Notfallhandbuch festgehalten, wer was wann im Falle eines IT-Ausfalls zu tun hat.

Wie erstellt man ein gutes IT-Notfallhandbuch?

Der häufigste Fehler ist, sich rein auf die IT-Systeme zu fokussieren. Selbstverständlich muss die aktuelle IT-Infrastruktur im IT-Notfallhandbuch dokumentiert sein. Allerdings sollte ein IT-Notfallhandbuch immer prozessorientiert und nicht hardware-/infrastruktur-orientiert sein. Schließlich ist es das Ziel die (umsatzgenerierenden) Business-Prozesse und nicht die IT-Infrastruktur per se abzusichern – Das ist ein kleiner aber feiner Unterschied. Der kurzfristige Ausfall einzelner Hard- und Software-Komponenten kann durchaus auch ohne größere Auswirkungen bleiben. Andere IT-Systeme wiederum, wie zum Beispiel Produktionsanlagen, sind hochgradig kritisch, da hier schon kürzeste Ausfälle monetären Schaden für das Unternehmen anrichten. Aus diesem Grund muss ein IT-Notfallhandbuch immer top-down, also vom Prozess hin zur Hardware, konzipiert werden.

Die Kritikalität

Der erste Schritt ist eine sogenannte Business Impact Analyse durchzuführen. Dabei werden alle Geschäftsprozesse analysiert und jeweils einer Kritikalitäts-Stufe zugeordnet. Die Einstufung von unkritisch bis hoch kritisch erfolgt in einer Matrix anhand von zwei Kriterien: Dauer des Ausfalls und monetärer Schaden.

  • Hochkritische Business-Prozesse generieren schon bei einem minimalen Ausfall einen enormen monetären Schaden.
  • Unkritische oder wenig kritische Prozesse hingegen werden auch bei einem längeren Ausfall, keinen oder nur einen sehr geringen Schaden erzeugen.

WICHTIG: Die Kritikalität kann aber auch Zeit abhängig sein und mit der Dauer des Ausfalls ansteigen. Intelligent designte Prozesse beinhalten zumeist verschiedene Puffer-Funktionalitäten und können somit Ausfälle bestimmter IT-Systeme für eine gewisse Zeit schadlos überbrücken. Erst wenn der Ausfall länger dauert, als der definierte Puffer-Zeitraum, entsteht ein Ausfall und somit monetärer Schaden.

Eine Ausnahme bilden dabei Notfälle, die Auswirkungen auf gesetzliche Bestimmungen wie zum Beispiel die DSGVO haben. Diese sind grundsätzlich hochkritisch und müssen umgehend behoben werden.

Hingegen sind strategische Prozesse, wie die Entwicklung neuer Produkte, meistens irrelevant. Ausfälle dieser Prozesse verursachen in der Regel keinen unmittelbaren Schaden oder die Zeitspanne bis ein messbarer Schaden eintritt ist sehr lang.

Die Business-IT-Abhängigkeit

Nachdem die Business-Prozesse priorisiert sind, werden diese auf die jeweils zugrundeliegende IT-Hardware heruntergebrochen. Hierbei ist es äußerst ratsam sowohl die Prozess- als auch die IT-System-Verantwortlichen einzubinden, damit auch wirklich alle Abhängigkeiten berücksichtig werden. Eine lückenlose Dokumentation aller Abhängigkeiten ist hier oberste Pflicht! Im Ernstfall müssen alle möglichen Ursachen berücksichtigen werden. Ein vollständiges Business-IT-Abhängigkeiten-Diagramm sollte dann in etwa wie im folgenden Beispiel aussehen:


Business-IT-Abhängigkeiten-Diagramm

 
Nur so ist es möglich bei Störungen der Geschäftsprozesse schnell die betroffenen IT-Systeme zu identifizieren. Zudem können auf diese Weise meist auch schon die Ursachen eingegrenzt werden.

TIPP: Notieren Sie im IT-Notfallhandbuch alle Informationen, die zum Zugang zur Hardware notwendigen sind! Zum Beispiel wie die Kombination für das elektronische Türschloss des Serverraums lautet oder wo der Schüssel aufbewahrt wird. Das spart im Notfall kostbare Zeit und Nerven.

Die Zuständigkeiten

Als letztes werden noch die Personen ermittelt, die über Wissen und Berechtigungen zu den einzelnen Prozessen und IT-Systemen verfügen. In der Regel sind das die selben Personen, die auch in die Erstellung der Business-IT-Abhängigkeiten-Diagramme involviert waren. Jede dieser Personen erhält eine Rolle mit exakten Anweisungen. Diese können je nach Prozess und Ausfallszenario variieren. Wichtig ist lediglich, dass jeder Beteiligte im Ernstfall sofort und eindeutig weiß, was er zu tun hat.

Für jede dieser Rollen wird nun eine Erreichbarkeit definiert und im IT-Notfallhandbuch für alle sichtbar hinterlegt. Es ist egal, ob eine Rolle mit einem eigenen Mitarbeiter oder mit einem Dienstleister, zum Beispiel für den Betrieb spezieller IT-Umgebungen, belegt ist. Bei Dienstleistern muss allerdings unbedingt darauf geachtet werden, dass ausreichende Service-Level-Agreements (SLAs), die diese Erreichbarkeiten und Antwortzeiten abdecken, vereinbart und beauftragt sind.

Dieses Top-Down-Vorgehen zeigt sehr schnell und deutlich wie stark die Business-Prozesse von der IT abhängen. Auf diese Weise ist es möglich verschiedene Ausfallszenarien direkt mit konkreten Schadenssummen zu beziffern. Dadurch ist es wiederum ein Leichtes Aufwand und Kosten für eine verlässliche IT-Notfallplanung betriebswirtschaftlich aufzurechnen. Und mit diesen Zahlen ist das Thema auch deutlich einfacher der Geschäftsführung zu vermitteln. Denn leider ist es in den meisten Unternehmen immer noch sehr schwierig die notwendige Awareness im Management zu schaffen.

Wie hält man das IT-Notfallhandbuch aktuell und vollständig?

Das Wichtigste ist, dass die Daten im IT-Notfallhandbuch aktuell und vollständig sind. Als Grundlage müssen alle identifizierten IT-Systeme möglichst umfangreich und vor allem aktuell dokumentiert sein. Angefangen bei den physikalischen Informationen wie Standort (Gebäude, Raum, Rack etc.) und Verkabelung bis hin zur jeweiligen Systemkonfiguration. Vor allem bei der Dokumentation der Systemkonfiguration ist die Aktualität der alles entscheidende Faktor. Der aktuelle Patch-Stand des Betriebssystems kann zum Beispiel bereits entscheidende Hinweise auf eine Ausfallursache geben.

Generell ist der Nutzen eines IT-Notfallhandbuchs komplett von dessen Aktualität abhängig. Wie anfangs bereits erwähnt, ist das Worst-Case-Szenario wenn sich der Incident-Manager auf das IT-Notfallhandbuch verlässt, dieses aber heillos veraltet ist. Aus diesem Grund ist eine regelmäßige Aktualisierung aller Daten im IT-Notfallhandbuch essentiell!

Meistens ist es allerdings leider so, dass nach der initialen Erstellung des IT-Notfallhandbuchs, das Projekt als abgeschlossen betrachtet wird. Die Pflege des Dokuments nimmt mit der Zeit immer mehr ab. Der Grund dafür ist, dass ein IT-Notfallhandbuch, nur in Ausnahmesituationen benötigt wird und somit im täglichen Betrieb in Vergessenheit gerät. Zudem tragen auch die Zeit- und Ressourcen-Problemen, die jeder IT-Abteilung zu schaffen machen, dazu bei, dass solche administrativen Themen gerne mal herunterpriorisiert werden.

Der einzige Ausweg wäre also, die Inventarisierung und Dokumentation der IT-Landschaft und im besten Fall auch noch die regelmäßige Aktualisierung des IT-Notfallhandbuchs mit Hilfe einer Software zu automatisieren.

Wie stellt man die ständige Verfügbarkeit eines IT-Notfallhandbuchs sicher?

Ist auch die Hürde der Aktualität gemeistert stellt sich unweigerlich die Frage: Wo und wie bewahre ich das IT-Notfallhandbuch auf?

IT-Notfallhandbücher werden, wie der Name schon sagt, dann benötigt, wenn die IT-Infrastruktur, beziehungsweise Teile davon, ausgefallen sind. Das kann auch das File-Share, auf dem das IT-Notfallhandbuch liegt, betreffen. Eine Ablage auf dem Share wäre somit sinnlos. Also muss der Zugriff auf das IT-Notfallhandbuch unbedingt auch dann ermöglicht werden, wenn die gesamte IT down ist.

Wahrscheinlich denken jetzt die meisten: „Ist doch einfach. Ich drucke das Dokument einfach aus.“ Vor dem Hintergrund, dass das IT-Notfallhandbuch aber immer aktuell sein muss, denke ich, dass niemand Lust hat, das komplette Dokument jede Woche neu auszudrucken. Zudem sind auf diese Weise unterschiedliche Versionen im Unternehmen im Umlauf. Und vom ökologischen Fußabdruck will ich gar nicht erst sprechen.

Alternative zwei wäre, das IT-Notfallhandbuch auf ein externes Speichermedium zu kopieren und dieses in einem feuerfesten Safe sicher aufzubewahren. Aber auch hier wäre wieder manuelles Eingreifen notwendig. Denn mit jeder Aktualisierung des IT-Notfallhandbuchs (wöchentlich!) müsste auch das Speichermedium jedes Mal aus dem Safe geholt und von Hand aktualisiert werden. Da ist der Aktualisierung des Speichermediums natürlich das gleiche Schicksal wie der manuellen Aktualisierung der Daten vorprogrammiert: Nach kurzer Zeit wird es nicht mehr gemacht!

Die dritte und eleganteste Lösung ist, das IT-Notfallhandbuch bei einem externen Cloud-Anbieter zu sichern. Cloud-Storage-Lösungen sind unabhängig von der eigenen IT und im Normalfall hochverfügbar. Zudem lassen sich die Zugriffsrechte feingranular konfigurieren. Auf diese Weise kann jeder Berechtigte, jederzeit von überall auf das IT-Notfallhandbuch zugreifen.

Mein Tipp:

Nutzen Sie Docusnap. Die Software inventarisiert und dokumentiert Ihre IT-Infrastruktur ganz automatisch, aktualisiert das IT-Notfallhandbuch selbständig und sichert dieses anschließend auf einem Cloud-Storage Ihrer Wahl. Auf diese Weise haben Sie den Prozess komplett automatisiert. Es ist kein manuelles Eingreifen mehr notwendig, für das ohnehin keine Zeit besteht und somit nach kurzem „hinten runterfällt“. Mit Docusnap können Sie sich endlich auf Ihr IT-Notfallhandbuch verlassen und dem Ernstfall entspannt entgegensehen.
 
So geht’s in Docusnap: