Die 10 schlimmsten Cloud-Ausfälle Detail - Computerwelt

Computerwelt: Aktuelle IT-News Österreich


04.09.2011 JR Raphael*

Die 10 schlimmsten Cloud-Ausfälle

Wir zeigen Ihnen, dass es auch Risiken birgt, die IT-Aufgaben in der Cloud zu erledigen. Die zehn größten Cloud-Ausfälle, die wir vorstellen, sind der Beweis dafür.

Als Konzept birgt die Cloud viele Vorteile. Sie können die eigenen selbst verwalteten Server links liegen lassen und neuen Speicher in der Cloud mieten. Jemand anderes kümmert sich um den Server und hält diese am Laufen. Sie können Ihre Daten dorthin verstauen, wo Sie wollen.

Doch Cloud Computing bringt auch Nachteile mit sich. Wenn Sie sich nicht mehr um die Instandhaltung kümmern müssen, verlieren Sie gleichzeitig einen Teil der Kontrollmöglichkeiten. Und die Sicherheitsbedenken sind nicht zu verachten. Aber all dies ist nichts im Vergleich zum schlimmsten möglichen Szenario: Wenn der Cloud-Service nicht mehr verfügbar ist.

Das können Ihnen die Unternehmen bestätigen, die vom Ausfall von Amazons Web Serviceim April betroffen war: „Wir waren ganz schön durch den Wind", sagt Nick Francis, dessen Start-Up-Unternehmen gerade eine Woche vor Amazons Problem gestartet war. „Wir waren darauf überhaupt nicht vorbereitet."

Francis war nicht der einzige, der überrascht wurde. Große US-Unternehmen wie Reddit und Foursquare sind ausgefallen, als Amazons Cloud gestört war.

„Die Cloud wurde als magisches Ding vermarktet, das arbeitet und völlig verlässlich ist", sagt Lew Moorman, der Hauptstratege bei Rackspace, einen Cloud-Provider, der bereits mehrere Ausfälle durchlebt hat. „Die Wahrheit ist, dass das Kaufen von IT-Leistungen über die Cloud nur einen anderen Weg des Kaufens darstellt. Und IT selbst ist von sich aus fehlerhaft. Wenn Sie sichergehen wollen, dass diese Fehler Ihnen nicht schaden, dann müssen Sie im Voraus planen."

Damit Sie wissen, wie ernst ein Cloud-Ausfall werden kann, zeigen wir Ihnen die zehn schlimmsten Cloud-Computing-Ausfälle, zu denen es bisher gekommen ist.

Amazons Web Service (AWS) Die Befreiung von der lästigen Netzwerk-Instandhaltungsarbeit ist das Hauptverkaufsargument für die Cloud. Und der Nachteil? Sie können nur tatenlos und hilflos zusehen, wenn die Änderung der Routine-Konfiguration des Cloud-Betreibers Ihre Daten vernichtet.

Genau das haben viele AWS-Kunden im letzten April am eigenen Leib erfahren, als Amazons im US-Bundesstaat Nord Virginia gelegenes Datenzentrum einer Störung zum Opfer fiel und komplett nutzlos wurde.

Der Fehler begann während einer Netzwerkaktualisierung, als eine falsch eingestellte Traffic-Schaltung ein Cluster von Amazon EBS (Elastic Block Store) Datenträgern in einen Wiederspiegelungssturm sandte. Just in dem Augenblick, als nach einer verfügbaren Box gesucht wurde, in der eine Sicherheitskopie der Daten abgelegt werden sollte, sind die Daten verloren gegangen.

Das ist zumindest die Kurz-Version. Amazons vollständige Erklärung fällt dagegen sehr lange aus.

Die Probleme bestanden für etwa vier Tage. Aber während viele Unternehmen ins Straucheln gerieten, überstanden andere Unternehmen wie Netflix diesen Sturm unbeschadet: „Wir verlassen uns lieber auf SimpleDB, S3 und Cassandra Services, die von dem Ausfall nicht betroffen waren", schrieben die Netflix-Entwickler in deren Blog-Eintrag über „Die Lehren, die Netflix aus dem AWS-Ausfall gezogen hat". Zustandslose Services und mehrere redundante aktuelle Kopien von Daten, die über mehrere zugängliche Zonen verteilt waren, seien der Schlüssel zum Erfolg gewesen. Nur so konnte Netflix dem Cloud-Ausfall von AWS entgehen.

Sie denken, dass Ihr Unternehmen so groß wie Netflix sein muss, damit es sicher sein kann? Dann denken Sie noch einmal nach. Twilio, ein Unternehmen, das Entwicklern dabei hilft Kommunikationslösungen in deren Web-Anwendungen zu integrieren, nutzte Amazons EC2, um den Großteil der Infrastruktur zu hosten. Dennoch hatte der Ausfall im April wenig bis keinen Einfluss auf dessen Stabilität.

„Wenn Sie sich auf eine Cloud einlassen, müssen Sie annehmen, dass das Netzwerk Störungen haben wird", sagt Evan Cooke, der Mitbegründer von Twilio. „Wir haben eine Infrastruktur um die Idee herum gebaut, dass der Hoster versagen kann und irgendwann versagen wird. Also haben wir uns nicht auf eine einzige Maschine oder eine einzelne Komponente in der Hauptarchitektur verlassen."

Screwup Smartphones machen es einfach, auch unterwegs auf Daten zuzugreifen. Doch was tun, wenn der dafür nötige Cloud-Dienst ausfällt? Wie bei Screwup, einem Partnerunternehmen von T-Mobile, hat im Herbst 2009 versagt hat.

Das zu Microsoft gehörende Partnerunternehmen war etwa eine Woche lang außer Gefecht gesetzt und ließ die Nutzer ohne Zugriff auf E-Mails, Kalenderinformationen und andere persönliche Daten. Dann hat Microsoft zugegeben, dass alle in der Cloud gespeicherten Daten verloren gegangen sind. Und sich nicht wiederherstellen ließen. Offensichtlich hatten die Leute bei Redmond vergessen Backups zu erstellen.

Es mag sein, dass sich die Technik in der Zwischenzeit verbessert hat, aber die Lehre daraus bleibt bestehen: Wenn es um wichtige Daten geht, sollten Sie sich niemals auf andere verlassen. Nehmen Sie nicht an, dass jemand anderes diese für Sie automatisch beschützt.

Google Mail Von allen Cloud-Services dürfte Google Mail der bekannteste sein. Ersetzen Sie Ihre wartungsaufwändigen Exchange-Server durch einen günstigen, verlässlichen E-Mail-Service, der von Postini gesichert wird. Was gibt es daran nicht zu mögen?

Die Antwort: Beim letzten Ausfall waren 150.000 Google Mail-Kunden betroffen. Als diese sich bei ihrem Benutzerkonto angemeldet haben, haben sie nur leere Seiten vorgefunden. Keine E-Mails, Ordner, nichts persönliches war mehr vorhanden. Wir müssen zu Gunsten von Google erwähnen, dass sie regelmäßige Aktualisierungen geliefert haben und versprochen hatten das Problem schnell zu lösen. Aber die Reparaturen dauerten bei manchen betroffenen Nutzern bis zu vier Tage lang.

„Wie konnte das passieren, wir hatten doch mehrere Kopien von Ihren Daten, in unterschiedlichen Datenzentren gespeichert?" Das hat sich Googles Vize-Präsident für Engineering Ben Treynor in einem Blog zu der Zeit gefragt. „Unter manchen seltenen Umständen können Softwarefehler mehrere Kopien der Daten betreffen. Genau dies ist in dem Fall geschehen."

Letztendlich musste Google physikalische Sicherungen verwenden, um die Daten wiederherzustellen. Zu guter Letzt hat das mehrstufige Datensicherungssystem funktioniert, aber dennoch waren tausende von Nutzern tagelang ohne ihre E-Mails.

Denken Sie also jetzt an Sicherheitskopien und Offline-Zugriffsmöglichkeiten. Denn wenn Sie diese brauchen könnte es bereits zu spät sein.

„Wenn Sie den Durchschnitt betrachten, dann ist es wahrscheinlicher, dass die Daten in der Cloud wiederherstellt werden, als wenn der Vorfall bei einer Einzelperson passiert wäre", sagt Ken Godskind von AlertSite. „Es ist nur so, das Fehlschläge im Web wesentlich größere Auswirkungen haben. Es sind automatisch wesentlich mehr Menschen betroffen."

Diesen Artikel

Bewertung:

Übermittlung Ihrer Stimme...
Noch nicht bewertet. Seien Sie der Erste, der diesen Artikel bewertet!
Klicken Sie auf den Bewertungsbalken, um diesen Artikel zu bewerten.
  Sponsored Links:

IT-News täglich per Newsletter

E-Mail:
Weitere CW-Newsletter

CW Premium Zugang

Whitepaper und Printausgabe lesen.  

kostenlos registrieren

Aktuelle Praxisreports

(c) FotoliaHunderte Berichte über IKT Projekte aus Österreich. Suchen Sie nach Unternehmen oder Lösungen.

Zum Thema

  • ELO Digital Office AT GmbH

    ELO Digital Office AT GmbH Mobile Lösungen und Applikationen, Dokumentenmanagement und ECM, Übernahme von Softwareprojekten, Systemintegration und Systemmanagement, Programmierung, Individual-Softwareentwicklung, IKT-Consulting,... mehr
  • SEQIS GmbH

    SEQIS GmbH Qualitätssicherung, Expertensysteme, Tools, Security Audits, E-Commerce-Software, B2B Dienste und Lösungen, Übernahme von Softwareprojekten,... mehr
  • VOQUZ Technologies GmbH

    VOQUZ Technologies GmbH Öffentliche Verwaltung, Maschinen- und Anlagenbau, Finanzdienstleistungen, Qualitätssicherung, Product Lifecycle Management (PLM), Mobile Lösungen und Applikationen, Management Informationssysteme (MIS),... mehr
  • Snap Consulting - Systemnahe Anwendungsprogrammierung u Beratung GmbH

    Snap Consulting - Systemnahe Anwendungsprogrammierung u Beratung GmbH Wasser- und Energieversorgung, Öffentliche Verwaltung, Medizin und Gesundheitswesen, Maschinen- und Anlagenbau, Luft- und Raumfahrttechnik, Logistik, Konsumgüterindustrie,... mehr

Hosted by:    Security Monitoring by: