RAID – Redundant Array of Independent Disks – IT-Berufe-Podcast #179
IT-Berufe-Podcast - Een podcast door Stefan Macke - Maandagen

Categorieën:
Um das beliebte Prüfungsthema RAID geht es in der einhundertneunundsiebzigsten Episode des IT-Berufe-Podcasts. Inhalt RAID: Redundant Array of Independent Disks (bzw. früher "inexpensive" statt "independent) Idee: Mehrere Festplatten zu einem Verbund ("array") zusammenschließen Ziel: Ausfallsicherheit und höhere Verfügbarkeit (durch Einführung von Redundanz) Bei Ausfall einer Festplatte kann sie getauscht und das RAID-Array wiederhergestellt werden ("Rebuild"), in dieser Phase ist das RAID durch die hohe Belastung aber anfälliger für einen weiteren Festplattenausfall. RAID ersetzt nicht die Datensicherung. Lösung: Hardware- oder Software-RAID Hardware mit speziellen RAID-Controllern Software meist schon ins Betriebssystem eingebaut (z.B. in Linux) Alternative: JBOD (just a bunch of disks) Es gibt verschiedene RAID-Level Kriterien: Mindestanzahl Festplatten, Ausfallwahrscheinlichkeit, maximal verkraftbare ausgefallene Festplatten, Lese-/Schreibgeschwindigkeit, Nettokapazität RAID 0: Striping keine Redundanz, Merksatz: "0 Redundanz", "0 Sicherheit" mindestens 2 Festplatten nötig teilt Festplatten in gleich große Blöcke auf und verteilt die Daten darauf (stripes) Kapazität kann komplett genutzt werden dadurch kann schneller gelesen werden, da von mehreren Festplatten parallel gelesen wird auch das Schreiben geht schneller, da Daten parallel auf mehrere Festplatten geschrieben werden (aufgeteilt) fällt eine Festplatte aus, ist der gesamte Verbund defekt Ausfallwahrscheinlichkeit steigt, da Einzelwahrscheinlichkeiten multipliziert werden (z.B. bei 1% Ausfallwahrscheinlichkeit 2,97% gesamt) Einsatz: Streaming (viel Lesen, wenig Schreiben, Datenverlust verkraftbar bzw. anderweitig abgesichert), mehrere kleine zu einem großen Datenträger zusammenbauen Nachteil: hohe Ausfallwahrscheinlichkeit RAID 1: Mirroring komplette Redundanz, Merksatz: "1-zu-1-Kopie" mindestens 2 Festplatten nötig Daten werden auf allen Festplatten identisch abgelegt Kapazität wird halbiert oder gedrittelt usw. Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden Schreiben dauert länger, weil Daten auf mehrere Platten geschrieben werden müssen (Redundanz) Verbund fällt erst aus, wenn alle Festplatten ausfallen Ausfallwahrscheinlichkeit sinkt deutlich, z.B. bei 1% je Platte auf 0,0001% auch Mirroring ist keine Datensicherung, Viren werden sofort auf alle Platten geschrieben Einsatz: Hochverfügbarkeitssysteme Nachteil: geringe Nettokapazität RAID 5: Paritäten Teilredundanz durch Ablage von Paritätsinformationen mindestens 3 Festplatten nötig zusätzlich zu den auf mehrere Festplatten verteilten Daten werden auf allen Festplatten Paritätsinformationen (z.B. XOR) je Datenblock abgelegt Kapazität wird reduziert (z.B. 2/3 bei drei Festplatten) Lesegeschwindigkeit kann erhöht werden, indem Daten parallel von mehreren Festplatten gelesen werden Schreiben dauert durch Berechnung der Parität länger Verbund fällt erst aus, wenn zwei Festplatten defekt sind Ausfallwahrscheinlichkeit sinkt, z.B. bei 1% je Platte auf 0,0298% Nachteil: bei häufigen Schreibzugriffen durch Berechnung der Parität langsamer Irrelevante RAID-Level RAID 2: Striping mit Fehlerkorrektur, nur bei Großrechnern eingesetzt RAID 3/4: wie RAID 5 nur mit dedizierter Paritätsfestplatte (die dadurch stark belastet und zum Flaschenhals wird), bei RAID 3 wird auf Byte-Ebene und bei RAID 4 auf Block-Ebene gestript RAID 6: wie 5 nur mit doppelter Parität Kombinationen von RAID-Levels best of both worlds aus anderen RAID-Leveln immer von links nach rechts lesen und im Diagramm von unten nach oben: 01 -> zuerst werden zwei RAID 0 erstellt und dann zu einem RAID 1 zusammengebaut ein Leg ist das RAID-Array "unten" im Bild, aus dem das übergeordnete zusammengesetzt wird es werden mind. 4 Festplatten benötigt Kapazität wird halbiert Verbund verträgt zwei Festplattenausfälle, aber es ist wichtig, welche Platten ausfallen RAID 01