Op deze pagina ...
Een kort overzicht m.b.t. RAID en
RAID-termen.
N.b.: Een geupdate versei kan op Tweaking4All worden gevonden ... Wat is RAID en Hoe werkt RAID …
RAID is een afkorting van "Redundant
Array of Independent Disks" ook wel "Redundant Array of
Inexpensive Disks".
Deze disk technologie wordt veel
toegepast in servers waar grote hoeveelheden data opgeslagen wordt
welke ook nog eens beveiligd moet zijn en snel bereikbaar moet zijn.
RAID systemen gebruiken vaak SCSI
disks als basis, maar met de goedkope controllers van Promise
FastTrak, kunnen we nu ook IDE disks gebruiken.
|
|
Overzicht
Standaard Disk
In een normale thuis PC, wordt iedere diskdrive
gezien als een afzonderlijke disk, vaak herkenbaar aan hun eigen driveletter
zoals C,D,E, etc...
Data wordt dan door de controller naar de disk
gestuurd die de gebruiker aangeeft, waarbij de data achter elkaar (sequentieel)
naar deze disk gestuurd wordt. Dus de opgegeven data wordt op 1 en dezelfde
fisieke disk gestuurd.
RAID
In een RAID systeem worden meerdere harddisks gecombineerd
in een zogenaamde "array of disks" (groep van disks).
Elke array wordt door het computer systeem als een enkele
harddisk gezien, ook al bestaat deze array uit 2, 3, 4 of zelfs meer harddisks.
Een RAID systeem gebruikt geavanceerd technieken voor
de data bewerkingen welke dankbaar gebruik maken van het feit dat meerdere
disks gebruikt worden als een enkele disk. Door deze combinatie van disks
kan een dergelijke array sneller en veiliger werken als een enkele disk.
Er bestaan verschillende RAID niveau's met ieder een
eigen toepassingsgebied.
Welk RAID systeem moet ik
gebruiken ?
3 korte vuistregels;
- SNEL voor thuis en klein kantoor gebruik;
Gebruik RAID-0 voor een snel en goedkoop RAID systeem.
- VEILIG voor thuis en klein kantoor gebruik;
Gebruik RAID-1 voor een veilig en goedkoop RAID systeem.
- VEILIG voor (groot) zakelijk gebruik; Gebruik
RAID-5 voor betrouwbare server opslag in netwerk omgevingen.
minimum 2
|
- SNELSTE I/O
voor alle data
- Eenvoudige opzet
- Eenvoudig in te voeren |
- Geen fout
correcties
- 1 disk defect = alle data verloren |
minimum 2
|
- 100% fout
correctie
- Eenvoudige opzet |
- Duur
- LANGZAAM lezen |
minimum 3
|
- Fout correctie,
ook voor disks zonder ingebouwd correctie systeem |
- Geen praktische
toepassing |
minimum 3
|
- SNELLE I/O
voor sequentiele data
- Efficiente fout correctie |
- Kan niet
gelijktijdig schrijven en lezen |
minimum 3
|
- SNEL lezen
voor alle data
- Efficiente fout correctie |
- Erg LANGZAAM
schrijven |
minimum 3
|
- SNEL lezen
voor alle data
- Efficiente fout correctie
- Beste voor netwerk toepassingen |
- LANGZAMER
als RAID-0 en RAID-1
- Duur |
RAID-0
RAID-0 (ook bekend als "striping")
zet enkele disks in een array als een grote disk.
De kleinste disk capaciteit in de array bepaald de omvang
van dit RAID systeem. Als je bijvoorbeeld een 1GB, 2GB en een 5GB drisk
in een RAID-0 array zet, dan zal de PC een disk zien van 3GB (1GB x 3)
t.o.v. de 8GB die maximaal beschikbaar kan zijn.
RAID-0 is ongeveer 2 keer zo snel als een enkele disk.
De scnelheid wordt in basis gehaald doordat met; byte1 naar disk1, byte
2 naar disk2, byte3 naar disk1 , etc. stuurt. Hierdoor is de helft van
de snelheid nodig voor disk 1 en de andere helft voor disk 2.
Aangezien de PC een hogere snelheid aan kan, zien we
dat de snelheid van de array de som van de maximale snelheden de individuele
disks in de array kan zijn.
Merk op: de gebruikte blok omvang is vaak
32 KByte of 64 KByte i.p.v. het voorbeeld waarin ik spreek over 1 byte;
Merk op: RAID-0 biedt geen fout correcties!
Als 1 disk uitvalt, dan is alle data verloren!
Spanning: Bij spanning zet men in
feite de disks "achter" elkaar in tegenstelling tot parallel
bij striping. Het voordeel hiervan is dan dat men 1 grote disk heeft.
Snelheid en veiligheid worden hier niet beter door. Er zijn dus geen voordelen
behalve dan dat men 1 grote disk kan gebruiken.
Merk op: Spanning wordt niet door
alle RAID controllers ondersteund.
RAID-1
RAID-1 (ook bekend als "mirroring")
kopieert in feite de gegevens van disk 1 identiek naar disk 2.
Als een disk dan uitvalt, zal het computer systeem dit
niet merken en gewoon blijven werken (de RAID controller zal de gebruiker
natuurlijk wel een hint geven dat er iets fout is - maar het systeem werkt
gewoon door). Ook hier wordt de array als een enkele disk gezien.
Hoewel RAID-1 de mist efficiente manier van data beveiliging
is, en voor conventionele SCSI RAID systemen ook een erg dure oplossing
is, biedt dit voor IDE oplossingen een simpele maar erg betrouwbare oplossing
als het om veiligheid gaat. Als we 1-op-1 mirroring toepassen met twee
4GB drisks, dan zal het systeem maar 1 4GB drisk zien.
Ook hier zien we weer dat de kleinste disk bepalend
is voor de uiteindelijke opslagcapaciteit van het RAID systeem.
RAID-2
RAID-2 gebruikt parallel data transport (zie ook striping
bij RAID-0) aangevuld met een zogenaamde Hamming Error Correct Code (ECC),
bedoeld voor disks die geen eigen fout correctie hebben (alle moderne
disks hebben dit wel!).
Omdat Hamming code gecompliceerd is, heeft men vaak
meer dan 1 disk nodig voor de opslag van deze code. Deze RAID variant
heeft geen voordelen t.o.v. RAID-3.
RAID-3
RAID-3 werkt bijna hetzelfde als RAID-2 met het verschil
dat men 1 disk gebruikt voor het opslaan van een berekende pariteit.
Ook hier wordt parallel gewerkt zoals we dat bij striping
in RAID-0 zagen. De pariteit wordt per setje bytes (A0, A1 en A2) berekend
en opgeslagen.
Als een disk uitvalt, kan men terug berekenen wat de
verloren byte had moeten zijn. Echter door deze parity data, kan een RAID-3
system vaak niet gelijktijdig schrijven en lezen.
Optimaal gebruik van deze techniek zien we bij de opslag
van grote sequentiele data hoeveelheden.
RAID-4
RAID-4 is identiek aan RAID-3 maar nu wordt de pariteit
niet per byte maar per data blok berekend. Een deregelijk data block bijvoorbeeld
32 of 64 Kbyte groot. Hierdoor kan gelijktijdig geschreven en gelezen
worden mits er geen overlapping plaats vindt.
Er is hier geen significant voordeel ten opzichte van
RAID-5.
RAID-5
RAID 5 werkt identiek aan RAID-4, met het verschil dat
de pariteit-blok niet op 1 enkele disk opgeslagen wordt maar verdeeld
wordt over de disks in de array.
Dit zou men dus kunnen zien als RAID-0, aangevuld met
pariteit-data om het e.e.a. veiliger te maken - RAID-5 kan het beste in
een netwerk omgeveing gebruikt worden;
Merk op: RAID-5 wordt niet standaard ondersteund
door de goedkopere IDE RAID controllers - de duurdere modellen kunnen
dit echter wel.
|