IT-Ausfall im Unternehmen – Sind Sie darauf vorbereitet?

Zuletzt aktualisiert: Mo, 16. Oktober 2023

60% aller Unternehmen hatten 2022 mit einem IT-Ausfall zu kämpfen. Das geht aus der neuesten Ausfallstatistik des renomierten Uptime Institutes für die Jahre 2020 bis 2022 hervor. Grundlage dieser Analyse sind die beiden Studien „Uptime Institute Annual Global Data Center Survey 2022“ und „Uptime Institute Data Center Resiliency Survey 2023“, mit zusammen ca. 1.600 Teilnehmern.
Die Auswertung zeigt auch, dass Ausfälle immer teurer werden. 2022 haben nur noch 29% der Befragten angegeben, dass die Kosten für die Ausfälle unter 100.000 $ geblieben sind. 2019 sagten das hingegen noch 60%. Und auch die Ausfälle mit Kosten über eine Million Dollar sind deutlich gestiegen – von 11% 2019 auf 25% in 2022.

Das zeigt eindrucksvoll, was wir bereits alle wissen: Die IT ist mittlerweile unerlässlich und eine stabile IT-Infrastruktur somit immer wichtiger. Was kann man also tun, um IT-Ausfälle zu verhindern?
 

IT-Ausfälle können jeden treffen

Nichts!

In allen Unternehmen werden die Betriebsprozesse immer mehr automatisiert, so dass ganze Geschäftsabläufe von der Angebotserstellung bis hin zur Produktfertigung teilweise schon komplett ohne menschliches Zutun ablaufen. Durch diese weitreichende Vernetzung von IT-Systemen, können aber schon kleinste Änderungen an einzelnen Komponenten eine enorme Auswirkung haben. Wenn nur ein Teilchen fehlt, stürzt der ganze Prozess wie ein Kartenhaus zusammen.

Dabei reichen sehr banale Ereignisse, um einen Serverausfall zu erleiden. So sind zum Beispiel Stromausfälle und Hardware-Defekte die häufigsten Gründe für eine IT-Störung, gefolgt von Software- und Anwenderfehlern. All das ist nur sehr schwer vermeidbar. Selbstverständlich kann man mit einem Notstrom-Aggregat Stromausfälle abfangen. Aber auch dabei kommt es in der Regel zu kurzen Unterbrechungen bis das Notstromaggregat angelaufen ist. Das reicht aus, dass die IT-Systeme unkontrolliert abschalten, was zu Hard- und Softwareschäden sowie Datenverlust führen kann. Auch defekter Hard- und Software kann man schwer vorbeugen. Aber am wenigsten schützen kann sich ein Unternehmen vor dem Faktor Mensch. Egal, ob durch einen Fehler oder vorsätzlich, ein IT-Administrator hat weitreichende Eingriffsmöglichkeiten auf die IT und dadurch auf das gesamte Unternehmen.

Aber auch die kriminellen Kräfte darf man nicht vergessen. Es gibt zu jederzeit unzählige Hacker, die mittels Schadsoftware oder direkten Angriffen versuchen Firmen-Netzwerke zu kapern. Auch hier gilt, dass selbst der beste Schutz umgangen werden kann. Der ehemalige FBI Direktor James Comey sagte dazu: „Es gibt zwei Arten von Unternehmen: Die einen sind gehackt worden. Die anderen wissen es nur noch nicht.“​

Zusammenfassend gesagt: Angriffe und Ausfälle sind unvermeidbar und können jeden treffen. Aus diesem Grund wäre es grob fahrlässig auf diesen Ernstfall nicht vorbereitet zu sein.
 

Schadenspotenzial eines IT-Ausfalls

Aber was sind die Folgen eines IT-Ausfalls? Wie groß ist das Schadenspotenzial?

Das Spektrum hierbei ist riesig: Vom kurzfristigen, partiellen Ausfall eines einzelnen Systems bis hin zum tagelangen Totalausfall kann alles passieren. Im selben Maß differieren auch die Schäden, von ein paar Tausend Euro bis hin zu Millionen- und bei Großkonzernen gar Milliarden-Beträgen. Entscheidend ist, welche Systeme ausfallen und wie lange.

Um das Gefahrenpotenzial besser einschätzen zu können, sollte jedes IT-System eine eigene Kritikalitätsstufe erhalten. Diese wird dadurch bestimmt, wie groß der Schaden bei einer potentiellen Störung ist. Die Einstufung kann sich allerdings mit der Dauer des Ausfalls erhöhen. So puffern zum Beispiel so gut wie alle Produktionssysteme die zur Verarbeitung notwendigen Daten. Dadurch können kürzere Ausfälle abgefangen werden. Dauert die Störung allerdings länger, als die vorgehaltenen Daten reichen, steht die Produktion. Somit haben die datenliefernden Systeme in diesem Beispiel anfangs eine geringe Kritikalitätsstufe, die sich dann schlagartig maximiert.

Im Schnitt verzeichnen deutsche, mittelständische Unternehmen vier IT-Ausfälle pro Jahr. Das hat eine Studie der Firma Techconsult im Auftrag von Hewlett-Packard ergeben. Bei durchschnittlichen Kosten je Ausfall-Stunde von rund 25.000 Euro und 3,8 Stunden Lösungszeit, bis alle Systeme wieder laufen, ergibt sich im deutschen Mittelstand ein durchschnittlicher Gesamtschaden von rund 380.000 Euro pro Unternehmen und Jahr durch nicht verfügbare IT.
 

Welche Auswirkungen hätte ein Ausfall der IT in Ihrem Unternehmen?

Neben dem Beispiel der Produktionssysteme, kann aber auch eine Telefonanlage geschäftskritisch sein, wenn darüber zum Beispiel der Vertrieb erfolgt. Oder auch eine Webseite kann kritisch sein, wenn man im Online-Handel tätig ist. Die Möglichkeiten sind hier genauso mannigfaltig und individuell, wie die Unternehmen selbst.

Aus diesem Grund sollte sich jeder IT-Leiter oder Geschäftsführer die Fragen stellen: Wie abhängig sind meine Betriebsprozesse von der IT? Wie lange verkraften wir einen IT-Ausfall?

Um diese Fragen zuverlässig und belastbar beantworten zu können, benötigt man tiefgreifendes Wissen über alle Geschäftsprozesse. Es ist notwendig jeden (kritischen) Prozess bis auf die Hard- und Software, auf die er aufbaut, herunterzubrechen. Diese Daten müssen anschließend bei jeder Änderung angepasst und immer aktuell gehalten werden. Nur so ist es möglich, den Überblick zu behalten und im Ernstfall schnell reagieren zu können.
 

Wie gut sind Sie auf einen IT-Ausfall vorbereitet?

Geschwindigkeit ist der entscheidende Faktor. Um so länger der Ausfall dauert, um so teurer wird es. Und wie wir am Beispiel der daten-puffernden Produktionssysteme gesehen haben, steigen die Kosten relativ zur Dauer der Störung nicht linear sondern meist exponentiell.

Doch wer den Verursacher nicht kennt, kann das Problem nicht lösen! Das klingt einfach, tatsächlich jedoch ist die Fehlersuche in den meisten Fällen der zeitraubenste Faktor bei der Lösung von IT-Störungen.

In der Regel fällt ein IT-Ausfall dadurch auf, dass ein Business-Prozess nicht mehr funktioniert; sei es, dass die Mitarbeiter keine E-Mails mehr empfangen oder dass das Produktionsband steht. Anschließend beginnt die Suche: Welche Software ist betroffen? Auf welcher Hardware ist diese gehostet? Welche Beziehungen haben die betroffenen Systeme zu anderen IT-Komponenten? Und wer ist überhaupt verantwortlich?

In den meisten Notfällen wird sehr viel Zeit auf die Beantwortung dieser Fragen verschwendet, bis endlich die eigentliche Problembehebung beginnen kann.

Professionelles Incident-Management sieht anders aus:

  • Klar definierte Zuständigkeiten und Kommunikationswege
  • Aktuelle und vollständige Dokumentation der IT-Landschaft
  • Dokumentierte Abhängigkeiten der Businessprozesse von der IT

 
All das muss jederzeit für alle Beteiligten verfügbar sein. Nur so ist es möglich, in kürzester Zeit alle relevanten Informationen zu sammeln, die verantwortlichen Personen zu involvieren und schnellst möglich wieder einen geregelten Betrieb herzustellen.
 

Notfallpläne mit Docusnap automatisieren

Diese Notfallpläne und -konzepte müssen individuell sein wie das Unternehmen selbst. Übergreifende Standards sind nur selten möglich.

Da Vollständigkeit und Aktualität hierbei das A und O sind, bedarf es viel manuellem Aufwand die Notfalldokumente zu pflegen. Zeit und Manpower, die in den meisten Unternehmen nur selten gewährt werden.

Docusnap schafft hierbei Abhilfe. Es erfasst automatisch und wiederkehrend Ihr komplettes IT-Netzwerk und macht damit zeitintensive manuelle Tätigkeiten obsolet. Docusnap unterstützt Sie bei der Erstellung von Notfallplänen und aktualisiert und verteilt diese automatisch. So sind alle Kollegen immer auf dem neuesten Stand und Sie sind stets gewappnet und können heikle Situationen schnell und problemlos meistern.
 
 
 
Artikel ursprünglich veröffentlicht am 12.11.2019.
Am 16.10.2023 Aktualisierung der Ausfallstatistik und allgemeine Überarbeitung.