1. Foren
  2. Kommentare
  3. Wirtschaft
  4. Alle Kommentare zum Artikel
  5. › IT-Probleme: Serverausfall legt…

"ein fehlerhafter Datenspeicher"

  1. Thema

Neues Thema Ansicht wechseln


  1. "ein fehlerhafter Datenspeicher"

    Autor: JouMxyzptlk 16.10.19 - 17:02

    Da interessieren mich jetzt schon die Details wie ein einzelner Datenspeicher solche Auswirkungen haben kann.
    Bei der Größe sollte das doch alles redundant sein, SQL Cluster, Speichercluster bzw SAN-Cluster, Exchange-DAGs, Virtualisierungscluster. Hoffentlich mehrere Domaincontroller!
    Ein by-Design-Fail Problem? Oder ein "Beancounter SQL Cluster ist zu teuer" Problem?

    Ultra HD ist LOW RES! 8K bis 16K sind mein Metier.

  2. Re: "ein fehlerhafter Datenspeicher"

    Autor: Genie 16.10.19 - 17:09

    Einer musste ja kommen, der den ITlern von Porsche die Welt erklären muss.
    Zwischen Theorie & Praxis liegen schon immer Welten...

  3. Re: "ein fehlerhafter Datenspeicher"

    Autor: xUser 16.10.19 - 17:10

    JouMxyzptlk schrieb:
    --------------------------------------------------------------------------------
    > Da interessieren mich jetzt schon die Details wie ein einzelner
    > Datenspeicher solche Auswirkungen haben kann.
    > Bei der Größe sollte das doch alles redundant sein, SQL Cluster,
    > Speichercluster bzw SAN-Cluster, Exchange-DAGs, Virtualisierungscluster.
    > Hoffentlich mehrere Domaincontroller!
    > Ein by-Design-Fail Problem? Oder ein "Beancounter SQL Cluster ist zu teuer"
    > Problem?

    Wenn das SAN-Cluster ausgefallen ist, dann steht alles. Ab einen gewissen Punkt wird es schwierig und bei so komplexen Systemen kann man immer mal was übersehen.

  4. Re: "ein fehlerhafter Datenspeicher"

    Autor: donadi 16.10.19 - 17:16

    Danke.
    Das sich immer ein SOHO Admin finden muss, der alles besser weiß.
    Und in der Pressemitteilung wird sicher keine detaillierte Fehleranalyse veröffentlicht.

  5. Re: "ein fehlerhafter Datenspeicher"

    Autor: DerFux 16.10.19 - 17:38

    Kann mir gut vorstellen, dass es was mit FaultTolerance zu tun hatte. Wenn HA auf Fault-Tolerance läuft und Fault-Tolerance einen Fehler schmeißt bzw. nicht richtig arbeitet .. lol .. wahrscheinlich iwo im Detail ein Design Fehler ^^

  6. Re: "ein fehlerhafter Datenspeicher"

    Autor: notuf 16.10.19 - 17:43

    xUser schrieb:
    --------------------------------------------------------------------------------
    > JouMxyzptlk schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Da interessieren mich jetzt schon die Details wie ein einzelner
    > > Datenspeicher solche Auswirkungen haben kann.
    > > Bei der Größe sollte das doch alles redundant sein, SQL Cluster,
    > > Speichercluster bzw SAN-Cluster, Exchange-DAGs, Virtualisierungscluster.
    > > Hoffentlich mehrere Domaincontroller!
    > > Ein by-Design-Fail Problem? Oder ein "Beancounter SQL Cluster ist zu
    > teuer"
    > > Problem?
    >
    > Wenn das SAN-Cluster ausgefallen ist, dann steht alles. Ab einen gewissen
    > Punkt wird es schwierig und bei so komplexen Systemen kann man immer mal
    > was übersehen.

    Die Systeme sind nicht komplex. Höchstens kompliziert.

  7. Re: "ein fehlerhafter Datenspeicher"

    Autor: JouMxyzptlk 16.10.19 - 19:01

    donadi schrieb:
    --------------------------------------------------------------------------------
    > Das sich immer ein SOHO Admin finden muss, der alles besser weiß.

    So wie sich auch immer einer findet der aus, egal was geschrieben wurde, daraus was trolliges bastelt. Bist du aus dem heise.de Forum ausgewandert?

  8. Re: "ein fehlerhafter Datenspeicher"

    Autor: Arib 16.10.19 - 20:49

    Nein, bei Porsche gibt es nur einen Domaincontroller. Aber dafür zwei Endrohre.

  9. Re: "ein fehlerhafter Datenspeicher"

    Autor: Tet 16.10.19 - 21:54

    JouMxyzptlk schrieb:
    --------------------------------------------------------------------------------
    > Da interessieren mich jetzt schon die Details wie ein einzelner
    > Datenspeicher solche Auswirkungen haben kann.
    > Bei der Größe sollte das doch alles redundant sein, SQL Cluster,
    > Speichercluster bzw SAN-Cluster, Exchange-DAGs, Virtualisierungscluster.
    > Hoffentlich mehrere Domaincontroller!
    > Ein by-Design-Fail Problem? Oder ein "Beancounter SQL Cluster ist zu teuer"
    > Problem?

    Es gibt immer Punkte, an denen auch redundante Systeme ausfallen können. Ein besonderes Problem sind Fehler, die nicht als solche erkannt werden. Das redundant vorgehaltene System springt nicht ein, weil kein Fehler erkannt wird und das fehlerhafte System läuft Amok. Besonders kritisch sind dabei Systeme, die eigentlich andere überwachen und schützen sollen.

  10. Re: "ein fehlerhafter Datenspeicher"

    Autor: tzarchen 16.10.19 - 23:56

    Es wird heutzutage so vieles als Hochverfügbar oder Ausfallsicher verkauft.
    Dabei muss man allerdings wenn es das Produkt wirklich hergibt einiges in der Infrastruktur beachten.
    Echte Redundanz ist möglich aber bei den Kosten kommt dann der Rückzieher. Ein bisschen Redundanz reicht ja auch.
    Wenn dann eines dieser scheinbar redundante Systeme ein zentrales System ist dann kann man nur hoffen, dass der Ernstfall ausbleibt.

  11. Re: "ein fehlerhafter Datenspeicher"

    Autor: Seelbreaker 17.10.19 - 00:32

    Genie schrieb:
    --------------------------------------------------------------------------------
    > Einer musste ja kommen, der den ITlern von Porsche die Welt erklären muss.
    >
    > Zwischen Theorie & Praxis liegen schon immer Welten...


    Zauberwort Budget.
    Wenn das nicht da ist oder nach Vorstellung des oder der Konzepte für den K-Fall gekürzt wird, gibt es kein Geld für die Umsetzung

    Wenn es das Storage bei Porsche zerlegt hat, dann ist halt Schicht im Sacht. (ich kann mir nicht vorstellen das da nur ein System von einem Hersteller global steht).

    Fault tolerance hilft nur bedingt wenn die primäre und sekundäre auf zwei luns vom selben Storage liegen ;-)
    Aber solche Kleinigkeiten werden die schon beachten.

    Aber was genau da passiert ist, wird nur Porsche wissen. (Split Brain und der Tiebreaker hat nicht funktioniert? Das wünsche ich niemanden! )
    Auch wenn es mich selbst näher interessiert, weil man aus so einem Fehler lernen kann.

    Porsche zahlt wohl erstmal Lehrgeld mit dem Ausfall und dann wird es besser gemacht.

    An der Stelle, mal die Frage in den Raum gestellt, was machen eure Datensicherung so? ;-)



    3 mal bearbeitet, zuletzt am 17.10.19 00:39 durch Seelbreaker.

  12. Re: "ein fehlerhafter Datenspeicher"

    Autor: thinksimple 17.10.19 - 08:25

    JouMxyzptlk schrieb:
    --------------------------------------------------------------------------------
    > donadi schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Das sich immer ein SOHO Admin finden muss, der alles besser weiß.
    >
    > So wie sich auch immer einer findet der aus, egal was geschrieben wurde,
    > daraus was trolliges bastelt. Bist du aus dem heise.de Forum ausgewandert?

    Aber wo er recht hat, hat er recht.

    Würden die Unternehmen das Forum hier nutzen wären alle Probleme für immer erledigt. :-)

    Alleinfahrende Autos hin oder her,
    aber Backpapierzuschnitte sind schon eine geile Erfindung.

  13. Re: "ein fehlerhafter Datenspeicher"

    Autor: Lionfish 17.10.19 - 11:55

    Porsche ist NetApp Referenzkunde.
    Laut der Success Story nutzt Porsche den Netpp Metro Cluster inkl. Disaster Recovery Site.
    Eigentlich alles richtig gemacht und da wurde auch beim Design nicht gespart.
    Warum es dann trotzdem nicht funktioniert hat ist eine gute Frage.

  14. Re: "ein fehlerhafter Datenspeicher"

    Autor: Genie 17.10.19 - 12:32

    Lionfish schrieb:
    --------------------------------------------------------------------------------
    > Warum es dann trotzdem nicht funktioniert hat ist eine gute Frage.

    Wie gesagt: Theorie & Praxis sind 2 verschiedene Welten...

  15. Re: "ein fehlerhafter Datenspeicher"

    Autor: tzarchen 17.10.19 - 15:28

    Lionfish schrieb:
    --------------------------------------------------------------------------------
    > Porsche ist NetApp Referenzkunde.
    > Laut der Success Story nutzt Porsche den Netpp Metro Cluster inkl. Disaster
    > Recovery Site.
    > Eigentlich alles richtig gemacht und da wurde auch beim Design nicht
    > gespart.
    > Warum es dann trotzdem nicht funktioniert hat ist eine gute Frage.

    Die Frage kann ich dir gerne beantworten. Storage Replikation ist halt nicht für jede Anwendung die Beste Methode sie Hochverfügbar zu machen. Das sagt dir der NetApp Vertriebler natürlich nicht. Eigentlich müsste aus jedem Bereich der erntsprechende Experte bewerten ob das System die Anforderungen erfüllt. Aber warum sollte man den Dba, den virtualisierungs oder AD Admin noch fragen wenn die Storage Jungs schon gesagt haben, dass alles funktionieren wird.

  16. Re: "ein fehlerhafter Datenspeicher"

    Autor: jose.ramirez 17.10.19 - 17:10

    DerFux schrieb:
    --------------------------------------------------------------------------------
    > Kann mir gut vorstellen, dass es was mit FaultTolerance zu tun hatte. Wenn
    > HA auf Fault-Tolerance läuft und Fault-Tolerance einen Fehler schmeißt bzw.
    > nicht richtig arbeitet

    Gibts normalerweise eine Warnung und die Systeme laufen weiter.

  17. Re: "ein fehlerhafter Datenspeicher"

    Autor: Hawk321 17.10.19 - 17:32

    tzarchen schrieb:
    --------------------------------------------------------------------------------
    > Lionfish schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Porsche ist NetApp Referenzkunde.
    > > Laut der Success Story nutzt Porsche den Netpp Metro Cluster inkl.
    > Disaster
    > > Recovery Site.
    > > Eigentlich alles richtig gemacht und da wurde auch beim Design nicht
    > > gespart.
    > > Warum es dann trotzdem nicht funktioniert hat ist eine gute Frage.
    >
    > Die Frage kann ich dir gerne beantworten. Storage Replikation ist halt
    > nicht für jede Anwendung die Beste Methode sie Hochverfügbar zu machen. Das
    > sagt dir der NetApp Vertriebler natürlich nicht. Eigentlich müsste aus
    > jedem Bereich der erntsprechende Experte bewerten ob das System die
    > Anforderungen erfüllt. Aber warum sollte man den Dba, den virtualisierungs
    > oder AD Admin noch fragen wenn die Storage Jungs schon gesagt haben, dass
    > alles funktionieren wird.

    Weil der Vertribler und der IT-Entscheider -in deren glorreichen Weisheit- intensiv in Google
    sich ein "101" angeguckt haben...verfasst von irgend einem Copy&Paste Autor.
    Oder weil der "Entscheider" meint, er kenne nun Prozesse, weil er "Prozessmanagement" studiert hat und Fronterfahrung nicht wichtig ist.

    Mal Spaß bei Seite:
    Die Struktur muss dort komplett fehl geplant sein....wenn so viele Server ausgefallen sind KANN da was nicht stimmen. Porsche wird garantiert nicht als Pressemitteilung raushauen:
    "Sorry, läuft alles in Docker und Docker war weg"

  18. Re: "ein fehlerhafter Datenspeicher"

    Autor: Lionfish 17.10.19 - 17:57

    So schlecht geplant ist die Umgebung nicht, wenn die NetApp Success Story stimmt.
    Danach nutzt Porsche u.a. auch für SAP eine NetApp System mit Metro Cluster , d.h. ein Active-Active System mit automatic Failover. Das ist nicht so schlecht. Warum jetzt der Schwenk nicht funktioniert hat oder ob gleichzeitig beide Systeme inopp gegangen sind, das ist eine gute Frage.
    Die Netapps wurden von Stemmer implementiert und das sind auch keine Anfänger.
    Ein automatic Failover gerade bei kritischen Systemen muss auch regelmässig getestet werden.
    Bin mal gespannt ob in der Zukunft die Hintergründe des Ausfalls noch publik werden.

  19. Re: "ein fehlerhafter Datenspeicher"

    Autor: tzarchen 17.10.19 - 19:27

    Jaja, Marketing BlaBla.
    Wenn ein Metrocluster Knoten ausfällt übernimmt ein anderer Kopf die Disks und nachdem das Problem behoben wurde werden sie zurückgegebe. Da reichen schon nicht korrekt eingestellte Disk Timeouts und du hast rebootende Server oder Dateisysteme die sich für den read-only Modus entschieden haben.
    Alles schon gesehen.
    Das mit dem DR Datacenter ist auch immer ganz nett, aber eine komplette Umgebung schaltet man in der Regel auch nicht einfach so um.
    In dem Whitepaper ist hauptsächlich viel Marketing und wenig technische Tiefe vorhanden.

  20. Re: "ein fehlerhafter Datenspeicher"

    Autor: Tet 17.10.19 - 22:00

    Lionfish schrieb:
    --------------------------------------------------------------------------------
    > Warum jetzt der Schwenk nicht funktioniert hat oder ob
    > gleichzeitig beide Systeme inopp gegangen sind, das ist eine gute Frage.

    Letzteres kann durchaus der Fall sein, vor allem dann, wenn der Fehler außerhalb der Systeme lag. Zum Beispiel könnte eine Diagnosehardware aufgrund des Datenfehlers fälschlicherweise die Server zum Schutz der Daten schlafen gelegt haben. Das sorgt dann auch für Ausfallkaskaden, da ein einfacher Neustart nur dazu führt, dass die Server gleich wieder runter gefahren werden.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. Deloitte, Frankfurt am Main, Hamburg, München, Berlin, Düsseldorf
  2. Fresenius Kabi Deutschland GmbH, Oberursel
  3. DRÄXLMAIER Group, Vilsbiburg bei Landshut
  4. ZfP Südwürttemberg, Bad Schussenried

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 29,99€
  2. 18,99€
  3. (-72%) 8,50€


Haben wir etwas übersehen?

E-Mail an news@golem.de


Threadripper 3970X/3960X im Test: AMD wird uneinholbar
Threadripper 3970X/3960X im Test
AMD wird uneinholbar

7-nm-Fertigung, Zen-2-Architektur und dank Chiplet-Design keine Scheduler-Probleme unter Windows 10: AMDs Threadripper v3 überzeugen auf voller Linie, die CPUs wie die Plattform. Intel hat im HEDT-Segment dem schlicht nichts entgegenzusetzen. Einzig Aufrüster dürften sich ärgern.
Ein Test von Marc Sauter

  1. Via Technologies Centaur zeigt x86-Chip mit AI-Block
  2. Nuvia Apples Chip-Chefarchitekt gründet CPU-Startup
  3. Tiger Lake Intel bestätigt 10-nm-Desktop-CPUs

Staupilot: Der Zulassungsstau löst sich langsam auf
Staupilot
Der Zulassungsstau löst sich langsam auf

Nach jahrelangen Verhandlungen soll es demnächst internationale Zulassungskriterien für hochautomatisierte Autos geben. Bei höheren Automatisierungsgraden strebt die Bundesregierung aber einen nationalen Alleingang an.
Ein Bericht von Friedhelm Greis

  1. Autonomes Fahren Ermittler geben Testfahrerin Hauptschuld an Uber-Unfall
  2. Ermittlungsberichte Wie die Uber-Software den tödlichen Unfall begünstigte
  3. Firmentochter gegründet VW will in fünf Jahren autonom fahren

Minikonsolen im Video-Vergleichstest: Die sieben sinnlosen Zwerge
Minikonsolen im Video-Vergleichstest
Die sieben sinnlosen Zwerge

Golem retro_ Eigentlich sollten wir die kleinen Retrokonsolen mögen. Aber bei mittelmäßiger Emulation, schlechter Steuerung und Verarbeitung wollten wir beim Testen mitunter über die sieben Berge flüchten.
Ein Test von Martin Wolf


    1. K-ZE: Elektro-Dacia soll 15.000 Euro kosten
      K-ZE
      Elektro-Dacia soll 15.000 Euro kosten

      Renault will den eigentlich nur für den chinesischen Markt gedachten Elektro-Mini-SUV K-ZE über seine Marke Dacia auch nach Europa bringen. Es könnte das günstigste vollwertige Elektroauto auf dem deutschen Markt werden.

    2. China: Yibin nimmt fahrer- und schienenlose Straßenbahn in Betrieb
      China
      Yibin nimmt fahrer- und schienenlose Straßenbahn in Betrieb

      In der chinesischen Großstadt Yibin fährt künftig eine Straßenbahn ohne Schienen: Auf Gummireifen folgt die Bahn einer Spur auf der Straße und kann bis zu 300 Personen befördern. Die Bahn ist auch autonom ohne Fahrer einsetzbar.

    3. IT: Für Berlins Windows-10-Umstellung wird es immer enger
      IT
      Für Berlins Windows-10-Umstellung wird es immer enger

      Das Betriebssystem Windows 7 ist ein Auslaufmodell: Im Januar 2020 beendet Microsoft den kostenlosen Support, dann drohen Sicherheitslücken. Doch in der Berliner Verwaltung warten noch Tausende Rechner auf ein Upgrade - 30.000 müssen wegen eines Fehlers zudem neu bespielt werden.


    1. 14:26

    2. 13:27

    3. 13:02

    4. 22:22

    5. 18:19

    6. 16:34

    7. 15:53

    8. 15:29