Uptime und Verfügbarkeit: Wie oft sollte die 9 hinter dem Komma stehen?

Blog

Always on“ ist aus dem Alltag von uns allen nicht mehr wegzudenken. Und das Erstaunliche dabei: Das zentrale Element der digitalen Wirtschaft bleibt in aller Regel unsichtbar – die Rechenzentren.

Ob geschäftlich oder privat genutzt, haben wir uns so sehr an die Verfügbarkeit beispielsweise von LTE gewöhnt, dass wir mit der gleichen Geschwindigkeit, mit der wir mobil surfen, vergessen, wo eigentlich dieses digitale Herz schlägt.

Denn nur bei Ausfällen wird uns bewusst, wie wichtig Rechenzentren tatsächlich für die digitale Versorgungskette sind. Diesen Sommer konnte man eindrucksvoll erleben, wie sich Ausfallzeiten ganz konkret auf den Gewinn eines Unternehmens auswirken – so musste United Airlines für 90 Minuten den kompletten Flugbetrieb einstellen, was für 1.162 Verspätungen und 62 Flugausfälle führte. Ähnliches gilt für mehrere Ausfälle der Börse in Singapur, was neben den entgangenen Transaktionen für einen immensen Reputationsschaden sorgte.

Doch wie können sich Unternehmen genau gegen solche Reputationsrisiken schützen? Diese Frage bleibt bestehen – und der Schlüssel liegt in der Frage nach der Verfügbarkeit in „Neunen“. Denn mit diesen Kennzahlen erhalten Unternehmen nicht nur Klarheit darüber, wie sie ihre Rechenzentren auf ein verlässliches Fundament stellen können; auch welche Verfügbarkeit zu erwarten ist, verbirgt sich hinter dem Komma.

Verfügbar heißt verlässlich – stimmt das?

Wer sich auf zu wenige Neunen hinter dem Komma verlässt, ist schnell verlassen: Das zeigt die allgemeine Definition von Verfügbarkeit. Diese bezieht sich auf die bedingte Wahrscheinlichkeit, dass ein System erwartungsgemäß funktioniert; was im Gegenzug wiederum bedeutet, dass im Fall des Falles das fragliche System auch wiederhergestellt werden kann, und das in einem vordefinierten Zeitkorridor. Diese gemittelte Widerherstellungszeit (MTTR, mean time to repair) stellt bei Verträgen mit Serviceanbietern einen wesentlichen Aspekt von Dienstgütevereinbarungen (SLA, service level agreement) dar. Man spricht hier häufig von „n Mal neun“: 3x9 bedeuten eine Verfügbarkeit von 99,9 %.

Verfügbarkeit unterscheidet sich technisch allerdings von Verlässlichkeit, wenn man diese wie folgt definiert: als die mittlere Betriebsdauer zwischen zwei Ausfällen (MTBF, mean time between failure) oder Fehlerrate. Im Gegensatz zu Verfügbarkeit ist die Verlässlichkeit oder Fehlersicherheit keine bedingte Wahrscheinlichkeit; auch beinhaltet sie weder Wartung noch Reparatur.

Wie viele Neunen hinter dem Komma müssen sein?

In der Tabelle stellen wir die jährlichen Ausfallzeiten den Neunen hinter dem Komma gegenüber – und selbst mit 5x9 (99,999 %) bleiben über fünf Minuten Ausfall pro Jahr möglich.

Prozentuale Verfügbarkeit Jährliche Ausfallzeit
99 % 88 Stunden
99,9 % 8,8 Stunden
99,99 % 53 Minuten
99,999 % 5,3 Minuten
99,9999 % 32 Sekunden

Vergegenwärtigt man sich die Beispiele von United Airlines und der Börse Singapur, ist ganz klar: Alles unterhalb von 5x9 kann den entscheidenden Unterschied zwischen wirtschaftlichem Erfolg und herben Verlusten machen.

99,9 % reichen nicht: Beispiele für Verfügbarkeit im Alltag

Warum es sich lohnt, den 100 % möglichst nahe zu kommen, zeigen unsere Beispielrechnungen – denn „nur“ 99,9 % Verfügbarkeit bedeuten im Alltag …

  • 44 Minuten im Monat Versorgung mit kontaminiertem Trinkwasser
  • 3 Bruchlandungen monatlich am Flughafen Heathrow
  • 3.000 verlorene Briefsendungen pro Minute beim US Postal Service
  • 2.000 Kunstfehler wöchentlich bei Operationen im Rahmen der staatlichen US-Gesundheitsversorgung
  • 9.000 fehlerhafte Überweisungen pro Stunde
  • 36.000 „verpasste“ Herzschläge – oder knapp neun Stunden Herzstillstand jedes Jahr

Genau wie beim Betrieb von Rechenzentren sieht man, dass im Alltagsvergleich die tolerierbare Fehlerrate äußert gering ausfällt – und lediglich 99,9 % Verfügbarkeit in der Praxis zu völlig inakzeptablen Ergebnissen führen.

Die Alternative für Unternehmen: Überlegene Verfügbarkeit wählen

Die Anforderungen aktueller IT-Services machen die Verfügbarkeit von Rechenzentren so wichtig wie noch nie zuvor. Und da sich immer mehr Unternehmen für hybride IT-Umgebungen entscheiden, hängen immer mehr geschäftskritische Anwendungen von einer funktionierenden Cloud ab: Cloud-Verbindungen sollten daher unbedingt mit 9x5-Verfügbarkeit betrieben werden, und das Rechenzentrum sollte unbedingt nachweisbar über die Kapazität verfügen, dies auch sicherzustellen.

Verfügbarkeit hängt in gewisser Weise immer auch von verschiedenen Eigenschaften eines Rechenzentrums ab; vom strukturellen Aufbau, dem Betrieb, der Konnektivität, der Nähe zu Geschäfts- und Privatkunden sowie nicht zuletzt von der räumlichen wie technischen Skalierbarkeit. Sucht ein Unternehmen nach einem externen Partner, so zählen diverse Erfolgsfaktoren: definierte Verfahrensweisen (MOP, method of procedure), standardisierte Betriebsverfahren (SOP, standard operating procedure), rigide Sicherheitsstandards und überlegene präzise technische Konstruktion.

Theoretisch könnte die Einstufung in Ratingklassen (Tier) ebenfalls interessant sein, jedoch hat sich gezeigt: Der „Track Record“, also die belegbare Kompetenz über längere Zeiträume, und erprobte Strukturen im Betrieb sind mindestens genauso wichtig, möchte man als Unternehmen Ausfallrisiken weitgehend minimieren.