Abo
  1. Foren
  2. Kommentare
  3. PC-Hardware
  4. Alle Kommentare zum Artikel
  5. › Erasure Coding: Das Ende von Raid…

RAID6 ist nicht starr

  1. Thema

Neues Thema Ansicht wechseln


  1. RAID6 ist nicht starr

    Autor: Enkhiel 09.07.19 - 12:30

    Also wenn auf Storage Arrays mit 100 Disken und mehr lediglich "stumpfes" Raid 6 verwendet wird, ist man als Hersteller selber Schuld. Gute Arrays fangen bereits mit dem Restore der defekten Platte, wenn diese ausfällt und lagern die Informationen so lange auf anderen Platten des Arrays aus.
    Wenn also nicht zufäligerweise 3 Platten gleichzeitig ausfallen, ist die Ausfallsicherheit von RAID6 durchaus höher als 2, der limitierende Faktor ist dann lediglich die Kapazität.

  2. Re: RAID6 ist nicht starr

    Autor: nachgefragt 09.07.19 - 13:04

    Enkhiel schrieb:
    --------------------------------------------------------------------------------
    > Wenn also nicht zufäligerweise 3 Platten gleichzeitig ausfallen, ist die
    > Ausfallsicherheit von RAID6 durchaus höher als 2, der limitierende Faktor
    > ist dann lediglich die Kapazität.
    Naja Zufall ist ja eigentlich auch nur ein nicht mathematischer Begriff für Wahrscheinlichkeit.
    Wenn man die 3 Platten alle zu unterschiedlichen Zeitpunkten gekauft und eingebaut hat, ist das "zufällig", baut man alle 3 gleichzeitig ein, hat das mit Zufall imho nur noch bedingt etwas zu tun.
    Ich habs jedenfalls schon einige mal erlebt, dass eine Platte ausfällt, während eine andere grade neu aufgebaut wird und eigentlich hoffe ich jedes mal, dass es nicht zufällig wieder passiert.



    1 mal bearbeitet, zuletzt am 09.07.19 13:07 durch nachgefragt.

  3. Re: RAID6 ist nicht starr

    Autor: dangi12012 09.07.19 - 13:22

    Ich durfte hier im Forum auch schon lesen das Leute extra darauf achten für das NAS baugleiche Festplatten mit aufeinanderfolgenden seriennummern zu haben.
    Da ist der Supergau vorprogrammiert. Wenn alle Platten gleich alt sind, aus der gleichen fabrik kommen und durch raid ähnlich belastet werden die Platten auch Zeitnah eingehen.

    Normalerweise genau nachdem die 1. Platte ausgefallen ist und der Rebuild begonnen wurde...

  4. Re: RAID6 ist nicht starr

    Autor: Katsuragi 09.07.19 - 13:28

    Enkhiel schrieb:
    --------------------------------------------------------------------------------
    > Also wenn auf Storage Arrays mit 100 Disken und mehr lediglich "stumpfes"
    > Raid 6 verwendet wird, ist man als Hersteller selber Schuld. Gute Arrays
    > fangen bereits mit dem Restore der defekten Platte, wenn diese ausfällt und
    > lagern die Informationen so lange auf anderen Platten des Arrays aus.
    > Wenn also nicht zufäligerweise 3 Platten gleichzeitig ausfallen, ist die
    > Ausfallsicherheit von RAID6 durchaus höher als 2, der limitierende Faktor
    > ist dann lediglich die Kapazität.

    sorry, aber das stimmt so nicht. Wie lagert denn Deiner Meinung nach ein RAID6-Array Daten einer ausgefallenen Platte "so lange" (während des Restore?) "woanders aus"? Dafür müsste es diese Daten aus der noch bestehenden Redundanz regenerieren - nennt sich Rebuild. Der Rebuild muss aber bei RAID immer für eine ganze Festplatte durchgeführt werden und dauert bei großen mechanischen Festplatten dem entsprechend lange. Wenn während dessen _irgendeine_ andere Festplatte ausfällt hat man keine Redundanz mehr, und wenn eine Dritte ausfällt sind _alle_ Daten des gesamten Arrays weg (bzw. nicht mehr wiederherstellbar "zerhackt"). Die Wahrscheinlichkeit dafür steigt mit der Anzahl der Festplatten im Array, und das ist genau der Kritikpunkt des Artikels.
    Ganz davon abgesehen funktioniert RAID prinzipbedingt nicht (gut) über mehrere Rechner hinweg. Dafür gibt es andere Speichertechniken, siehe Artikel.

    Edit: außerdem sind RAID-Arrays nur vergrößer- oder verkleinerbar, indem man das ganze Array Block für Block umbaut. Das ist ziemlich starr, denn es ist langsam und skaliert schlecht mit der Größe des Arrays. Modernere Block Storage-Systeme haben solche Beschränkungen nicht, beispielsweise Ceph. Hier kann man zur Laufzeit mit minimalem Leistungsaufwand Speicher hinzufügen und auch wieder entfernen (!).



    1 mal bearbeitet, zuletzt am 09.07.19 13:33 durch Katsuragi.

  5. Re: RAID6 ist nicht starr

    Autor: redmord 09.07.19 - 13:30

    Vielleicht kann man dann den Spare zum rotieren benutzen, so dass alle Platten auf unterschiedliche Betriebszeiten kommen. :-)

  6. Re: RAID6 ist nicht starr

    Autor: DooMRunneR 09.07.19 - 13:33

    Sachen gibts...

    IBM macht genau das gegenteil. Da wird extra darauf geachtet Disks aus verschiedenen Chargen zu verwenden.

  7. Re: RAID6 ist nicht starr

    Autor: Eheran 09.07.19 - 14:01

    >Die Wahrscheinlichkeit dafür steigt mit der Anzahl der Festplatten im Array, und das ist genau der Kritikpunkt des Artikels.
    Das ist kein Kritikpunkt. Wenn ich eine Redundanz von "10/15"* mit der von Raid6 vergleiche, also 10/12, dann bin ich selbst schuld. Das hat doch mit Raid6 nichts zu tun. Das ist wie wenn ich sage: Raid 1 ist ausfallsicherer als Raid 5... joa, gratuliere. Dafür braucht man halt auch viel mehr HDDs. Wo ist das Argument?


    *
    >Diese sagt aus, dass für zehn Datensymbole 15 Symbole geschrieben werden und fünf Teile ausfallen dürfen.

  8. Re: RAID6 ist nicht starr

    Autor: Enkhiel 09.07.19 - 14:20

    Katsuragi schrieb:
    --------------------------------------------------------------------------------
    > Enkhiel schrieb:
    > ---------------------------------------------------------------------------
    > -----
    > > Also wenn auf Storage Arrays mit 100 Disken und mehr lediglich
    > "stumpfes"
    > > Raid 6 verwendet wird, ist man als Hersteller selber Schuld. Gute Arrays
    > > fangen bereits mit dem Restore der defekten Platte, wenn diese ausfällt
    > und
    > > lagern die Informationen so lange auf anderen Platten des Arrays aus.
    > > Wenn also nicht zufäligerweise 3 Platten gleichzeitig ausfallen, ist die
    > > Ausfallsicherheit von RAID6 durchaus höher als 2, der limitierende
    > Faktor
    > > ist dann lediglich die Kapazität.
    >
    > sorry, aber das stimmt so nicht. Wie lagert denn Deiner Meinung nach ein
    > RAID6-Array Daten einer ausgefallenen Platte "so lange" (während des
    > Restore?) "woanders aus"? Dafür müsste es diese Daten aus der noch
    > bestehenden Redundanz regenerieren - nennt sich Rebuild. Der Rebuild muss
    > aber bei RAID immer für eine ganze Festplatte durchgeführt werden und
    > dauert bei großen mechanischen Festplatten dem entsprechend lange. Wenn
    > während dessen _irgendeine_ andere Festplatte ausfällt hat man keine
    > Redundanz mehr, und wenn eine Dritte ausfällt sind _alle_ Daten des
    > gesamten Arrays weg (bzw. nicht mehr wiederherstellbar "zerhackt"). Die
    > Wahrscheinlichkeit dafür steigt mit der Anzahl der Festplatten im Array,
    > und das ist genau der Kritikpunkt des Artikels.
    > Ganz davon abgesehen funktioniert RAID prinzipbedingt nicht (gut) über
    > mehrere Rechner hinweg. Dafür gibt es andere Speichertechniken, siehe
    > Artikel.
    >
    > Edit: außerdem sind RAID-Arrays nur vergrößer- oder verkleinerbar, indem
    > man das ganze Array Block für Block umbaut. Das ist ziemlich starr, denn es
    > ist langsam und skaliert schlecht mit der Größe des Arrays. Modernere Block
    > Storage-Systeme haben solche Beschränkungen nicht, beispielsweise Ceph.
    > Hier kann man zur Laufzeit mit minimalem Leistungsaufwand Speicher
    > hinzufügen und auch wieder entfernen (!).

    Sorry, ich rede von SAN, nicht NAS. Im SAN kannst du durchaus die einzelnen Blöcke rebuilden und auf anderen Disken des Arrays ablegen.

  9. Re: RAID6 ist nicht starr

    Autor: nachgefragt 09.07.19 - 15:27

    Hm und was sagt uns das jetzt in diesem Kontext?
    Ein SAN ist ja nicht ein Array. Ein SAN kann aus zich Arrays bestehen.
    Ein NAS kann Bestandteil eines SANs sein aber nicht umgekehrt.
    In einem SAN können zich RAID6 Arrays hängen, die jeweils für sich crashen können.



    1 mal bearbeitet, zuletzt am 09.07.19 15:39 durch nachgefragt.

  10. Re: RAID6 ist nicht starr

    Autor: kieleich 10.07.19 - 11:09

    dangi12012 schrieb:
    --------------------------------------------------------------------------------
    > Da ist der Supergau vorprogrammiert. Wenn alle Platten gleich alt sind, aus
    > der gleichen fabrik kommen und durch raid ähnlich belastet werden die
    > Platten auch Zeitnah eingehen.
    >
    > Normalerweise genau nachdem die 1. Platte ausgefallen ist und der Rebuild
    > begonnen wurde...

    Es ist völlig wurscht, ob deine Platten aus der gleichen Fabrik kommen, mit aufeinanderfolgenden Seriennummern, oder nicht. Festplatten nach X Laufzeit am gleichen Tag ausfallen zu lassen ist ein Zaubertrick den du nicht hinbekommst selbst wenn du es versuchst. Der Verschleiß ist bei jeder Platte eben so wie konkrete Ausfallursache völlig anders.

    Ein RAID ist auch keine Gleichschaltung, RAID hat Hotspots, die Zugriffe sind ungleich verteilt. Und im Gehäuse ist auch nicht jeder Festplattenslot gleich, die eine sitzt besser im Luftstrom, die andere bekommt mehr Vibrationen ab, etc.

    Das mit den gleichen Seriennummern, das ist ne Religion, ne Ausrede, Larifari. Hat mit Realität nix zu tun.

    RAIDs fallen in der Praxis auseinander weil der Rebuild Monate zu spät angestoßen wird, weil die Festplatten nicht getestet werden oder Fehler einfach ignoriert werden.

    Gleichzeitig ausfallen können Platten auch mal aber das ist dann wirklich - die absolute Ausnahme solange keine äußeren Faktoren im Spiel sind.

  11. Re: RAID6 ist nicht starr

    Autor: UserName-001 10.07.19 - 14:10

    Das ist dann kein RAID6.

    Generell ist eine zu große Raid Gruppe bei RAID 5 und 6 tödlich, da ein Reconstruct oder Extend einfach zu lange dauert.

    Unser ehemaliger Backup Server hatte 48x8 TB in zwei RAID6 Volumes. Beim Ausfall einer SAS HDD brauchte der LSI/Avago/... über drei Tage um die Spare zu integrieren. Es passierte in zwei Jahren zwei mal, das in dieser Zeit -mitunter- wegen der Hohen Belastung eine zweite Platte ausgefallen ist. Das Erweitern der RAID's hat übrigens sechs Wochen gedauert, pro neuer HDD, die aufgenommen wurde.....

    Ich habe dann auf RAID 5EE migriert mit deutlich kleineren RAID Gruppen und so Extent und Reconstruct Zeiten auf unter 8h gebracht. Das hat zwar bedeutet, das jeder Raid Stripe nur den Ausfall einer HDD verkraftet hat, aber gestreut über die 48 Platten war es trotz dem eine Verbesserung.

    Seit 2019 ist übrigens eine alte NetApp FAS6290 mit vier DS4246 mit jeweils 8TB Trays im Einsatz.
    Durch Raid DP keine Wartezeit beim Erweitern der Aggregate und Rebuildzeiten von unter 4h.
    Keine Werbung für NetApp, da das System in Anbetracht der Leistung 10fach zu teuer ist. Wir haben die aber im RZ ausrangiert und sie fristet nun mit ausreichend Spare Parts noch ein Dasein als Disk Based Backup Cache, bevor alles auf Tape geht.

    Also alles eine Sache der Raid Gruppen Größe und durchaus auch möglich das mit hunderten von Disks zu machen.

  1. Thema

Neues Thema Ansicht wechseln


Um zu kommentieren, loggen Sie sich bitte ein oder registrieren Sie sich. Zum Login

Stellenmarkt
  1. VS HEIBO Logistics GmbH, Verden (Aller)
  2. DLR Deutsches Zentrum für Luft- und Raumfahrt e.V., Köln
  3. VALEO GmbH, Erlangen
  4. Topos Personalberatung Hamburg, Nordrhein-Westfalen

Golem pur
  • Golem.de ohne Werbung nutzen

Anzeige
Spiele-Angebote
  1. 23,99€
  2. (-81%) 3,75€
  3. 1,19€
  4. 4,19€


Haben wir etwas übersehen?

E-Mail an news@golem.de


In eigener Sache: Golem.de bietet Seminar zu TLS an
In eigener Sache
Golem.de bietet Seminar zu TLS an

Der Verschlüsselungsexperte und Golem.de-Redakteur Hanno Böck gibt einen Workshop zum wichtigsten Verschlüsselungsprotokoll im Netz. Am 24. und 25. September klärt er Admins, Pentester und IT-Sicherheitsexperten in Berlin über Funktionsweisen und Gefahren von TLS auf.

  1. In eigener Sache Zweiter Termin für Kubernetes-Seminar
  2. Leserumfrage Wie können wir dich unterstützen?
  3. In eigener Sache Was du schon immer über Kubernetes wissen wolltest

Ryzen 3900X/3700X im Test: AMDs 7-nm-CPUs lassen Intel hinter sich
Ryzen 3900X/3700X im Test
AMDs 7-nm-CPUs lassen Intel hinter sich

Das beste Prozessor-Design seit dem Athlon 64: Mit den Ryzen 3000 alias Matisse bringt AMD sehr leistungsstarke und Energie-effiziente CPUs zu niedrigen Preisen in den Handel. Obendrein laufen die auch auf zwei Jahre alten sowie günstigen Platinen mit schnellem DDR4-Speicher.
Ein Test von Marc Sauter

  1. Ryzen 3000 BIOS-Updates schalten PCIe Gen4 für ältere Boards frei
  2. Mehr Performance Windows 10 v1903 hat besseren Ryzen-Scheduler
  3. Picasso für Sockel AM4 AMD verlötet Ryzen 3400G für flottere iGPU

Transport Fever 2 angespielt: Wachstum ist doch nicht alles
Transport Fever 2 angespielt
Wachstum ist doch nicht alles

Wesentlich mehr Umfang, bessere Übersicht dank neuer Benutzerführung und eine Kampagne mit 18 Missionen: Das Schweizer Entwicklerstudio Urban Games hat Golem.de das Aufbauspiel Transport Fever 2 vorgestellt - bei einer Bahnfahrt.
Von Achim Fehrenbach

  1. Mordhau angespielt Die mit dem Schwertknauf zuschlagen
  2. Bus Simulator angespielt Zwischen Bodenschwelle und Haltestelle
  3. Bright Memory angespielt Brachialer PC-Shooter aus China

  1. Elektrisches Hypercar: Lotus Evija soll 2.000 PS haben
    Elektrisches Hypercar
    Lotus Evija soll 2.000 PS haben

    Lotus hat sein vollelektrisches Hypercar vorgestellt. Der Lotus Evija soll 2.000 PS haben und ab 1,7 Millionen britische Pfund kosten. Auch in anderen Bereichen wie bei der Ladegeschwindigkeit sind bemerkenswerte Daten veröffentlicht worden.

  2. Projektorkauf: Lumen, ANSI und mehr
    Projektorkauf
    Lumen, ANSI und mehr

    Gerade bei Projektoren werden auf Plattformen verschiedener Onlinehändler kuriose Angaben zur Helligkeit beziehungsweise Leuchtstärke gemacht - sofern diese überhaupt angegeben werden. Wir bringen etwas Licht ins Dunkel und beschäftigen uns mit Einheiten rund um das Thema Helligkeit.

  3. Telefónica: Software-Fehler beschert O2-Kunden erhöhtes Datenvolumen
    Telefónica
    Software-Fehler beschert O2-Kunden erhöhtes Datenvolumen

    Telefónica gibt sich kulant. Der Mobilfunknetzbetreiber hatte einigen O2-Kunden aufgrund eines Software-Fehlers ein doppelt so hohes ungedrosseltes Datenvolumen angezeigt. Als Reaktion erhalten die betroffenen Kunden das erhöhte Datenvolumen.


  1. 09:20

  2. 09:01

  3. 08:47

  4. 08:32

  5. 07:53

  6. 07:36

  7. 07:15

  8. 20:10