tehnologia raid: aplicatie de disk management
TRANSCRIPT
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
1/18
Tehnologia RAID: aplicaie de disk management
1. Obiectivul lucrrii
Lucrarea urmrete înelegerea tehnologiei RAID ( Redundant Array of Independent Disks), a modului de scriere i de citire al datelor i verificrile care auloc pentru fiecare nivel în parte.
2. Introducere teoretic
Tehnologia RAID ( Redundant Array of Independent/Inexpensive Disks – matrice redundant de discuri independente/ieftine) a fost definit pentru prima datde un grup de oameni de tiin de la Universitatea Berkeley din California, în 1987.Acetia au studiat posibilitatea de a utiliza dou sau mai multe hard disk-uri, astfel
încât acestea s apar sistemului gazd ca fiind un singur dispozitiv.Pe lâng definirea nivelelor RAID iniiale de la 1 la 5, oamenii de tiin austudiat data striping – distribuirea (partajarea) datelor pe o matrice de discurinerendundante. Cunoscut ca RAID 0, aceast configuraie nu ofer niciun mecanismde protecie a datelor, dar permite un flux maxim pentru aplicaiile care realizeaztransferuri masive de date, cum ar fi producia video digital.
Datorit evoluiei complexitii programelor, în timp au aprut urmtoarele probleme de rezolvat:
• asigurarea securitii datelor;• rirea vitezei de acces la date.S-a trecut la realizarea unor matrice de discuri fizice grupate logic în volume,
care trebuie s asigure distribuirea datelor, precum i implementarea unei structuricare s asigure securitatea datelor prin utilizarea redundanei.
Conceptul RAID implic patru componente:• zonarea datelor;• performane ridicate ale timpului de acces;• capacitate de stocare mrit;• redundana datelor i fiabilitatea.
2.1. Organizarea datelor
Organizarea datelor în cadrul ariilor de discuri presupune dou componentecomplementare:
• mecanismul de redundan;• schema de distribuie.Mecanismul de redundan specific tipul, scopul i localizarea fiecrei
informaii redundante din zona de discuri. În mod curent, se folosesc disk mirroring (dublarea discului) i informaia de paritate. Acest mecanism permite sistemului dediscuri s poat fi folosit f erori i dup ce un disc fizic s-a defectat, având locreconstrucia datelor.
Schema de distribuie a datelor definete algoritmul de translaie al adreseilogice externe (care este vizibil utilizatorului) i adresele fizice ale discurilor incluse
în zonele respective.Exist dou arhitecturi de baz:
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
2/18
Tehnologii i echipamente multimedia – lucrri practice8
• adresarea independent a fiecrui disc (arhitectura convenional);• disk striping (presupune împirea discului în pi egale).Distribuirea datelor presupune maparea adreselor logice ale volumului de
discuri la discurile fizice componente. Abordarea curent implic adresarea curent afiecrui disc i maparea blocului logic direct ctre blocul de pe fiecare disc.
Distribuirea datelor este f cut “manual” de ctre administratorii de sistem, de programele de aplicaii sau de ctre sistemul de operare. În general, administratorul desistem este responsabil pentru decizia privind stabilirea locului fiecrei date pe disc.
Arhitectura de disk striping transform mai multe spaii de adresare într-unsingur spaiu de adrese, spaiul unificat folosit de ctre procesorul gazd pentrurealizarea transferurilor necesare
2.2. Redundana datelor
Mecanismele de implementare a redundanei datelor sistemului de stocarereduc capacitatea de stocare, îns asigur protecia datelor în cazul cderii sistemului.Timpul mediu dintre dou defecte consecutive (MTBF – Mean Time Between
Failures) este de circa 500.000 ore; cu toate acestea timpul mediu de via al unuivolum de discuri neredundant este de ordinul lunilor, fiind invers propor ional cunumrul de discuri care alctuiesc sistemul. Dac discurile sunt adresate independent,se poate pierde 1/ N din numrul de fiiere sau 1/ N din datele fiecrui fiier în cazulfolosirii disk striping -ului. Din acest motiv, trebuie s se includ un mecanism deimplementare a redundanei datelor, mecanism care poate asigura protecia în cazuluneia sau a mai multor cderi ale discurilor. O soluie simpl de protecie este aceeade a folosi cópii identice; astfel, un bloc de date este scris pe M discuri distincte,datele considerându-se pierdute atunci când originalul i cele M copii sunt pierdute.
Pentru protecie se folosesc urmtoarele metode:• disk mirroring ;• disk duplexing ;• parity;Metoda disk mirroring realizeaz scrierea datelor identic pe cele dou discuri
distincte. În acest caz, fiecare sistem de N +1 discuri distincte poate supravieui cderiia N discuri.
Metoda disk duplexing realizeaz scrierea datelor tot pe dou discuri, înscanalul de date este distinct pentru fiecare disc.
Metoda parity folosete un disc suplimentar N+1, care stocheaz datele de paritate ale celorlalte N discuri. Se folosete unul din cei doi algoritmi de protecie:
codul Hamming de corecie al erorilor (ECC – Error Correction Code) sau operaialogic sau-exclusiv (XOR).Soluia software este inferioar , în acest caz procesorul gazd (host-processor )
trebuind s execute i operaiile de I/O pentru matricea de discuri, reducând astfel performanele sistemului; aceast soluie se practic atunci când se dorete capacitatede stocare mare i toleran la defectri.
Soluia hardware este optim, ea folosindu-se atunci când viteza i performanele de acces sunt factori critici. Aceast soluie este mai costisitoare, eaimplicând utilizarea unui controler dedicat comunicaiei dintre CPU i discuri; acestcontroler specializat conine un procesor RISC dedicat implementrii algoritmuluiRAID, în acest caz unitatea central (sau serverul sistemului, dac se lucreaz în
reea) fiind degrevate de operaiile I/O, meninându-i astfel performanele neafectate.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
3/18
Tehnologia RAID: aplicaie de disk management 9
2.3. Nivelele RAID
2.3.1. RAID 0
RAID 0 nu a fost definit de inginerii de la Berkeley, dar a devenit un termen
comun. Este o matrice de discuri independent, f redundan, care acceseaz datelede pe toate hard disk-urile la nivel de blocuri de date. Pentru a realiza acest lucru, estescris/citit primul bloc de date pe/de pe primul hard disk, apoi al doilea bloc pe/de pe aldoilea hard disk .a.m.d. RAID 0 se adreseaz doar creterii fluxului de date icapacitii de stocare. Datele sunt partajate (data striping ) pe mai multe discuri, f nicio informaie redundant.
Nivelul RAID 0 este reprezentat în figura 1.
Fig. 1. RAID 0: Non-redundant striped array – matrice de discuri cu date distribuite, nerendundant
La acest nivel nu exist niciun fel de toleran la erori. Dac apare un defect la
unul din hard disk-uri, întregul sistem se pr bute. La fel s-ar fi întâmplat i dacdatele s-ar fi gsit pe un singur disc. Avantajul principal al matricei de discuri estetransferul mai rapid de date. Acesta crete cu creterea numrului de uniti SCSI.
RAID 0 necesit minimum dou discuri pentru a fi implementat.• Scrierea se poate face simultan pe toate hard disk-urile.• Citirea se poate face simultan de pe toate hard disk-urile
2.3.2. RAID 1
Aceast tehnologie realizeaz tolerana la erori altfel decât RAID 0, 3 sau 5. ÎnRAID 1, când se face scrierea datelor pe disc, se face o copie exact a acestora pe un
al doilea disc (mirror disk – disc oglind), în mod automat i transparent pentrusistem, aplicaie sau utilizator. Discul oglind devine astfel o copie exact a discului
principal.Interfaa cu discurile se poate face cu unul sau dou controlere. Un singur
controler ofer o performan de citire/scriere asemtoare celei a unui singur harddisk. Dac se folosesc dou controlere (câte unul pentru fiecare hard disk =duplexing ), se reduce riscul de a avea un singur dispozitiv care, în cazul unui defect,ar duce la cderea ambelor hard disk-uri. De asemenea, duplexing -ul poate îmbunirata de transfer prin scrierea/citirea alternativ a datelor pe/de pe cele dou uniti.Comparativ, în cazul unui singur controler, performana la scriere este mai redus,
pentru c datele trebuie scrise întâi pe discul principal i apoi pe discul „oglind”. Nivelul RAID 1 este reprezentat în figura 2.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
4/18
Tehnologii i echipamente multimedia – lucrri practice10
Fig. 2. RAID 1: Mirrored array – matrice de discuri „oglindite” (dublate).
Între nivelele RAID, nivelul 1 ofer cea mai mare disponibilitate a datelor, pentru c sunt meninute dou cópii complete. În plus, performana la citire poate fiîmbunit dac controlerul matricei de discuri permite citirea simultan de pe
ambele uniti ale unei perechi.La scriere, va aprea o uoar scdere în performan, comparativ cu scrierea pe un disc obinuit. O disponibilitate mai mare poate fi obinut dac cele dou discuriale unei perechi sunt conectate la magistrale I/O separate. Marele dezavantaj este cnumai jumtate din capacitatea de stocare este efectiv util i mrirea acesteia se poateface numai în perechi de discuri.
RAID 1 necesit minimum dou discuri pentru a fi implementat.• Datele se scriu pe o pereche de hard disk-uri.• Citirile se pot face simultan de pe toate hard disk-urile.
2.3.3. RAID 2
RAID 2 stocheaz datele pe un grup de discuri împindu-le în „felii”(chunks), de obicei de mrimea unui sector. Un cod Hamming pentru fiecare ,,felie”este stocat pe un disc separat, numit check disk . Codul permite i corecia erorilor.
Datele sunt partajate pe mai multe hard disk-uri, câteva dintre ele fiinddedicate stocrii informaiilor de detecie i corecie a erorilor (ECC – Error Checking and Correction) pentru fiecare sector. Oricum, pentru c cele mai multe din hard disk-urile actuale au incluse faciliti ECC la nivel de sector ca facilitate standard, RAID 2nu ofer avantaje semnificative comparativ cu arhitectura RAID 3.
Fig. 3. RAID 3: Parallel array with ECC – matrice paralel cu corecie ECC.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
5/18
Tehnologia RAID: aplicaie de disk management 11
Nivelul RAID 2 este reprezentat în figura 3.În prezent, productorii au renunat s mai fabrice matrice RAID 2.RAID 2 necesit minimum dou discuri.• Datele sunt distribuite pe toate hard disk-urile.• Citirea se face de pe toate hard disk-urile.
2.3.4. RAID 3
În RAID 3, datele sunt distribuite pe mai multe discuri, la nivel de bit sauoctet. Unul din hard disk-urile din matrice asigur protecia datelor, pstrând octetulde verificare a pariti pentru fiecare unitate de alocare. La fel ca la RAID 0, discurilesunt accesate simultan, dar exist în plus hard disk-ul de paritate.
Nivelul RAID 3 este reprezentat în figura 4.
Fig. 4. RAID 3: Parallel array with parity – matrice paralel cu informaii de paritate.
Datele sunt scrise/citite simultan pe/de pe toate unitile, iar bitul de paritateeste calculat i comparat cu cel de pe discul de paritate (la citire), sau scris perespectivul disc (la operaia de scriere). Astfel, pentru fiecare octet scris, se calculeazun bit de paritate pentru a menine integritatea datelor. Aceasta permite ca matricea dediscuri i sistemul s fie 100% funcionale i în cazul defectrii unui hard disk dinmatrice. În acest caz, se poate continua citirea sau scrierea de pe celelalte uniti. Bitulde paritate permite refacerea datelor de pe discul defect. Înlocuirea unitii defecte se
poate face on-line (hot-swapped ), dup care controlerul matricei de discurireconstruiete datele pe acesta.
Avantajele RAID 3 fa de nivelele anterioare este c procentul ocupat deinformaia redundant (de paritate) din totalul capacitii de stocare descrete pesur ce crete numrul hard disk-urilor.
De asemenea, dispune de ci paralele de transmitere a datelor, oferind astfelrate de transfer ridicate pentru aplicaiile care manipuleaz fiiere de dimensiuni mari.Capacitatea matricei poate fi mrit cu câte un hard disk sau în grupuri.
RAID 3 necesit minimum trei discuri pentru a fi implementat.• Scrierea i citirea se face pe/de pe toate hard disk-urile.• Accesul paralel reduce timpul de citire pentru fiierele mari.
2.3.5. RAID 4
În RAID 4, informaia de paritate este întreesut cu datele utile la nivel desector dau bloc de date. Ca la RAID 3, un singur drive este utilizat pentru stocarea
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
6/18
Tehnologii i echipamente multimedia – lucrri practice12
datelor redundante, folosind un octet de paritate pentru fiecare bloc de date. Cile paralele de transfer a datelor i distribuia datelor pe hard disk-urile din matrice lanivel de sector sau bloc permit efectuarea de operaii independente pe diversele unitii executarea în paralel a operaiilor de intrare/ieire.
Nivelul RAID 4 este identic cu RAID 3, cu excepia faptului c se utilizeaz
uniti de alocare mai mari, astfel încât informaiile pot fi citite de pe un hard disk dinmatrice independent de discul de paritate. Acest lucru permite suprapunerea în timp aoperaiilor de citire.
Nivelul RAID 4 este reprezentat în figura 5.
Fig. 5. RAID 4: Striped array with parity – matrice de discuri cu datele distribuite, cu paritate.
RAID 4 ofer performane ridicate de citire i relativ bune de scriere. Aceastaeste o soluie de utilitate general, aplicabil mai ales acolo unde raportul citiri/scrierieste ridicat. Astfel, RAID 4 este o alegere bun pentru transferuri de blocuri de datemici, tipice pentru sistemele de procesare a tranzaciilor.
Performanele la scriere sunt sczute, pentru c la fiecare scriere trebuie s sescrie i bitul de paritate pe hard disk-ul respectiv. Astfel, hard disk-ul de paritatedevine o frân în calea performanei ridicate când sunt necesare multe scrieri aleinformaiei de paritate. În acest caz, RAID 5 este o soluie mai bun, deoareceinformaia de paritate este distribuit pe toate discurile disponibile.
RAID 4 aproape c nu a fost implementat în practic, pentru c nu ofer avantaje semnificative fa de RAID 5.
RAID 4 necesit minimum trei discuri pentru a fi implementat.• Fiecare operaie de scriere trebuie s actualizeze drive-ul de paritate.• Citirea se poate face simultan de pe toate hard disk-urile.
2.3.6. RAID 5
RAID 5 combin fluxul masiv de date oferit de RAID 1 – prin partajareadatelor la nivel de bloc – cu mecanismul de refacere a datelor prin intermediulinformaiilor de paritate. Acest nivel de toleran la erori integreaz informaia de
paritate la nivel de sector cu partajarea datelor i informaiilor de paritate pe toate harddisk-urile, f a avea deci o unitate dedicat stocrii informaiilor de paritate. Aceasta
permite multiple operaii de intrare/ieire concurente, ceea ce conduce la un flux dedate îmbunit, cu meninerea integritii datelor. Un disc anume din matrice esteaccesat doar atunci când trebuie scrise/citite date sau informaii de paritate pe/de peacesta.
Nivelul RAID 5 este reprezentat în figura 6.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
7/18
Tehnologia RAID: aplicaie de disk management 13
Fig. 6. RAID 5: Striped array with distributed parity – matrice distribuit cu paritate distribuit.
În RAID 5, discurile pot r spunde independent cererilor de acces, ceea ceofer o performan sporit la citire într-un mediu cu solicitri intense de acces.
Datorit informaiilor de paritate, o matrice RAID 5 poate supravieui cderii unuidisc f pierderea datelor sau întreruperea accesului la acestea.
Punctul forte al acestei tehnologii este manipularea unui numr mare de fiieremici. Rata de transfer este ridicat, pentru c nu mai exist strangularea de la RAID 4datorat drive-ului de paritate.
Dei nivelul RAID 5 este mai eficient din punct de vedere al costurilor, pentru nu mai este necesar un drive separat pentru paritate, performan a la scriere are desuferit.
Fiecare operaie de scriere necesit 4 accese independente la disc. Întâi, datelevechi i informaia de paritate este citit de pe discuri separate. Apoi este calculatnoua paritate. În fine, noile date i informaiile de paritate sunt scrise pe discuriseparate.
Muli productori de sisteme RAID utilizeaz caching -ul pentru a compensa performanele slabe la scriere. În acest caz, este important ca acesta s fie susinut deun sistem UPS (Uninterruptible Power Supply).
În aplicaiile grafice, dezavantajul RAID 5 fa de RAID 3 este slaba performan la scriere datorat informaiilor de paritate distribuite, astfel încât RAID5 este de obicei întâlnit în aplicaii cu numr mare de operaii de citire/scriere scurte.Utilizarea maxim a capacitii se obine atunci matricea are mai puin de 7 discuri.La un numr mai mare, aceasta este asemtoare nivelului RAID 3.
RAID 5 necesit minimum trei discuri pentru a fi implementat.
• Scrierea necesit actualizarea paritii.• Citirile se pot face simultan de pe toate hard disk-urile.
2.3.6.1. Reactualizarea paritii
Când data este scris în matricea RAID 5, informaia de paritate trebuie s fiereactualizat în unul din urmtoarele moduri (vezi figura 7a, 7b):
1. În primul mod, informaia de paritate este o operaie XOR a datelor de pefiecare disc din matrice. Ori de câte ori data de pe oricare disc este schimbat ,celelalte discuri din matrice care memoreaz date sunt citite i li se aplic o operaieXOR pentru a crea noua paritate. Aceasta implic accesarea fiecrui drive din matrice
pentru fiecare operaie de scriere.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
8/18
Tehnologii i echipamente multimedia – lucrri practice14
Fig. 7.a. Reactualizarea paritii în timpul scrierilor cu RAID 5 (modul 1).
Data Data Data PARITY
XOR XOR
Write
Read
W rite
Read
Fig. 7.b. Reactualizarea paritii în timpul scrierilor cu RAID 5 (modul 2).
2. Al doilea mod implic gsirea biilor de date care au fost schimbai de ctreoperaia de scriere, iar apoi schimbarea biilor de paritate corespunztori. Aceastmetod este acompaniat mai întâi de citirea datei vechi pentru a fi rescris. Aceastdat este aplicat unui XOR cu noua dat care va fi scris. Rezultatul este o masc de
bit (bit mask ), care are 1 în poziia fiecrui bit care a fost schimbat. Aceast masc de bit este apoi aplicat unui XOR cu vechea informaie de paritate care este citit de ladrive-ul de paritate din matrice. În acest fel, este posibil s se determine care bii dinvechea paritate au fost schimbai, iar noua paritate reactualizat este apoi scris înapoi
pe discul de paritate. Aceasta rezult în doar dou citiri, dou scrieri i dou operaiiXOR.
Acest dezavantaj al memor rii informaiei de paritate mai târziu decât copiereadatelor este datorat timpului suplimentar de la durata operaiilor de scriere pân laregenerarea informaiei de paritate.
Acest timp adiional reduce performanele de scriere pentru RAID 5 fa deRAID 1 cu un factor cuprins între 3/5 i 1/3. Din acest motiv, nivelul RAID 5 nu esterecomandat pentru aplicaiile de scriere în care performana este important.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
9/18
Tehnologia RAID: aplicaie de disk management 15
2.3.6.2. Refacerea datelor
În cazul cderii unui disc, operaia de refacere a datelor const în folosireadiscurilor r mase (discul de paritate i discurile de date), datele ref cându-se cuaceeai sum de paritate folosit la construcia discului de paritate (vezi figura 8).
Data Data PARITY
XOR
Read
XOR
Read Read
Fig. 8. Procesul de reconstrucie al datelor pe un sistem cu RAID 5.
În cadrul nivelului RAID 5, data este împit de-a lungul tuturor discurilor din matrice, folosind felii largi, cu câte o felie pe „linie”, coninând datele de paritate.Alocarea acestei felii de paritate este rotit printre toate discurile din matrice, astfelîncât feliile succesive de paritate sunt întotdeauna scrise pe câte un disc diferit. Îneventualitatea „cderii” unuia din ele (drive failure), coninutul fiecrei felii lips
poate fi reconstruit din data de paritate pentru acea „linie”, astfel nepierzându-se
niciun fel de date. Cderea întregii matrice reclam cderea simultan a dou drive-uri – un eveniment foarte improbabil.Atunci când un disc defect este înlocuit într-o matrice RAID 1 sau 5,
controlerul SCSI va reconstrui data pierdut pe noul drive. Aceast operaie dereconstrucie are loc în decursul citirilor i scrierilor normale din matrice.
În cazul matricei RAID 1, reconstrucia va avea loc relativ repede, deoarece eaimplic doar copierea datei coninute în discul oglind pe noul disc reînlocuit. În cazulmatricei RAID 5, noua dat care urmeaz a fi scris pe cel mai nou reînlocuit disctrebuie s fie recreat prin citirea i aplicarea unei funcii XOR feliei de datecorespunztoare de la discurile remanente în matrice. Acest lucru cauzeaz odegradare considerabil a performanei pe durata operaiei de reconstruire, care va
dura cu atât mai mult cu cât sunt mai multe discuri în matrice.
2.3.7. RAID 6
RAID 6 poate fi imaginat ca fiind „RAID5, dar ceva mai mult”. Se bazeaz peaceeai arhitectur ca RAID5, dar cu un grup de benzi de paritate suplimentar (dubl). Scopul acestei duplicrii este de a îmbuni toleranta la defecte. RAID 6 se
poate ocupa de defectarea a dou discuri din arie, în timp ce alte configuraii RAID nu pot s se ocupe decât de un singur disc.
Din punct de vedere al performanei, RAID 6 este, în general, mai slab decâtRAID5 în termeni de scriere, datorit adugrii unui numr i mai mare de calcule de
paritate, dar poate fi mai rapid în termeni de citire, datorit împr tierii datelor pesteînc un hard disk.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
10/18
Tehnologii i echipamente multimedia – lucrri practice16
Fig. 9. RAID 6: Striped array with two independent distributed parity schemes – matrice distribuita cudou scheme independente de paritate distribuit.
Nivelul RAID 6 este reprezentat în figura 9.
La fel ca la RAID 4 i RAID 5, performana poate fi ajustat experimentânddiferite mrimi ale fâiilor.RAID 6 necesit minimum patru discuri pentru a fi implementat.• Scrierea necesit actualizarea paritii.• Citirile se pot face simultan de pe toate hard disk-urile.
2.3.8. RAID 7
Spre deosebire de celelalte nivele RAID, RAID 7 nu este un standard; este omarc înregistrat a firmei Storaqe Computer Corporation, folosit pentru a descriedesignul lor propriu de RAID. RAID 7 se bazeaz pe conceptele folosite la nivelele
RAID 3 i RAID 4, dar mult îmbunite în mediul limitrilor acelor nivele. O particularitate a acestui nivel este includerea unui cache aranjat în nivele multiple iun procesor real-time specializat, care se ocup cu sincronizarea ariei. Suportulhardware, în special cache-ul, permite ariei s se ocupe cu mai multe operaiisimultan, aceasta îmbunind performana i tolerana la defectri. În particular,RAID 7 ofer o performan îmbunit la citire i la scriere fa de RAID 3 iRAID 4, deoarece dependena de discul de paritate dedicat este mult redus prinadugarea hardware-ului. Desigur c performana crescut a lui RAID 7 se facesimit în costul crescut al acestuia. RAID 7 este o solu ie scump, fabricat i
promovat de o singur companie. Nivelul RAID 7 este reprezentat în figura 10.
Fig. 10. RAID 7: Asynchronous, cached striping with dedicated parity – cache asincron distribuit cu paritate dedicat.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
11/18
Tehnologia RAID: aplicaie de disk management 17
2.4. Nivele RAID hibride
Pentru crearea de nivele etajate de RAID, un nivel poate fi combinat cu altnivel, dar cel mai uzual sunt utilizate nivelele 0 si 1. Orice controler hardware (chiar sicele ATA paralel sau serial, foarte accesibile azi, incluse chiar pe placa de baz)
suport RAID 0, RAID 1 i RAID 0+1, mai rar RAID 10, în funcie de implementare.
2.4.1. RAID 0+1
RAID 0+1 este implementat ca o suprafa oglindit, ale crei segmente suntsuprafee RAID 0. RAID 0+1 are aceeai toleran la erori ca RAID 5 i acelaicontrol al toleranelor la erori ca oglindirea simpl. Ratele mari I/O se obin datoritmultiplelor segmente divizate.
Nivelul RAID 0+1 este reprezentat în figura 11.
Fig. 11. RAID 0+1: Striping and mirroring combination without parity – combinaie de distribuire ioglindire, f paritate.
RAID 0+1 nu trebuie confundat cu RAID 10. Defectarea unui singur drive vaduce la transformarea matricei într-o matrice RAID 0. RAID 0+1 ofer o scalabilitatefoarte limitat la un pre foarte mare. Este o soluie ideal pentru site-uri care necesito performan ridicat, dar nu vizeaz o fiabilitate maxim.
RAID 0+1 necesit minimum patru discuri pentru a fi implementat.
2.4.2. RAID 10
Este implementat ca o matrice distribuit, ale crei segmente sunt matriceRAID 1. RAID 10 are aceeai tolerant la erori ca RAID 1. Ratele de transfer mai
bune sunt obinute datorit distribuirii segmentelor RAID 1. În anumite circumstane,RAID 10 poate rezista la defectri multiple simultane ale discurilor. Este o soluiefoarte bun pentru sisteme care necesit RAID 1, deoarece aduce un plus de
performan fa de acesta.RAID 10 este foarte costisitor i are un nivel ridicat de control. Poate fi utilizat
în aplicaii cu servere de baze de date, care necesit o performan bun i toleran laerori.
RAID 10 necesit minimum patru discuri pentru a putea fi implementat. Nivelul RAID 10 este reprezentat în figura 12.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
12/18
Tehnologii i echipamente multimedia – lucrri practice18
Fig. 12. RAID 10: Mirroring and striping combination without parity – combinaie de oglindire idistribuire, f paritate.
2.4.3. RAID 53
RAID 53 ar trebui numit, de fapt, „RAID 03”, deoarece este implementat ca omatrice distribuit ale crei segmente sunt matrice RAID 3. RAID 53 are aceeaitoleran la defecte ca RAID 3 i acelai nivel de control.
Datorit segmentelor RAID 3, se obin rate mari de transfer, iar datoritdistribuirii RAID 0 se obin rate de transfer i mai bune pentru operaii descriere/citire scurte. Este folositor pentru sistemele care folosesc RAID 3 i necesitun plus de performan.
Fig. 13. RAID 53: High I/O rates and data transfer performance – transferuri I/O la rate mrite i
performan la transferul datelor.
Este foarte scump de implementat. Toate acele discurilor trebuie sincronizate,ceea ce limiteaz alegerea discului.
RAID 53 necesit minimum cinci discuri pentru implementare.
2.5. Fiabilitatea nivelelor RAID
MTTR ( Mean Time To Replace) este timpul cât matricea este defect. Acestaeste calculat f când suma între doi termeni. Primul este H , timpul pân cândtehnicianul observ c un disc s-a defectat i îl înlocuiete. H este aproximativ 0 dac
se folosete un disc de rezerv. Al doilea termen este timpul necesar refacerii datelor alterate. Într-un sistem optim în care controlerul poate ine ritmul cu rata de transfer a
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
13/18
Tehnologia RAID: aplicaie de disk management 19
discurilor i operaia XOR este f cut într-o singura rotaie, refacerea datelor poate ficalculat ca timpul necesar pentru citirea discurilor bune, operaia XOR/rotaie iscrierea datelor pe discul înlocuit. Astfel, considerând C ca fiind capacitatea i M fiindrata de transfer, MTTR este calculat cu relaia:
3
M C H MTTR += . (1)
Fiabilitatea unei matrice este legat de fiabilitatea discurilor i de numrul dedefeciuni ale discurilor care poate fi tolerat înainte ca matricea s devin inaccesibil.Fiabilitatea discurilor este caracterizat de timpul mediu dintre defeciuni, MTBF ( Mean Time Before Failure). Fiabilitatea unei matrice neredundante ca RAID 0 este egal cu raportul dintreetalonul MTBF i numrul de discuri N . Aceasta este cunoscut i sub numele de
MTTDL_DF ( Mean Time To Data Loss due to Disk Failure – timpul mediu pân la pierderea datelor datorat defeciunii discului):
N
MTBF DF MTTDL = _ . (2)
Deoarece matricea RAID 5 poate tolera defeciunea unui singur disc,fiabilitatea discurilor r mase se poate calcula cu relaia:
1 _ 5 _ _
−=
N
MTBF DEFECT R DF MTTDL . (3)
Combinând ecuaiile (2) i (3) i luând în considerare timpul de reconstruire alunui disc, se obine:
MTTR N N
MTTF e Fiabilitat RAID *)1(*
2
5 −= . (4)
Fiabilitatea pentru matricea RAID 6 se obine în mod asemtor:
2
3
6 *)2(*)1(* MTTR N N N
MTTF e Fiabilitat RAID −−= . (5)
Se consider c probabilitatea defectrii al unui al doilea disc dup primul estemult mai mare, datorit problemelor hardware aprute. Aceasta este cunoscut subnumele de defeciune corelat a discului.
Se presupune c etalonul MTBF al celui de-al doilea disc este o zecime dinetalonul MTBF al primului disc. Astfel, etalonul MTBF al celui de-al treilea disc esteo sutime din etalonul MTBF al primul disc etc.
Luând în considerare defectrile corelate ale discurilor, se obin urmtoarelerelaii:
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
14/18
Tehnologii i echipamente multimedia – lucrri practice20
MTTR N N
MTBF MTBF
R DF MTTDL*)1(*
10*
5 _ _ −
= , (6)
2*)2(*)1(*100*10*6 _ _ MTTR N N N
MTBF MTBF MTBF R DF MTTDL
−−= . (7)
Un al treilea factor pentru etalonul MTTDL este eecul citirii unuia sau al maimultor blocuri de pe discurile bune r mase în timpul reconstruiri datelor disculuidefectat. ansa ca aceasta s se întâmple este propor ional cu rata de eroare a biilor
BER ( Bit Error Rate), sau cu numrul mediu de bii care trebuie citii pentru a avea un bit eronat. Dac dimensiunea unui sector este de 512 octei, numrul de sectoare caretrebuie citite pentru a avea în medie un sector defect se poate calcula cu relaia:
8*512 _ _
BER Rate Error Sector = . (8)
Presupunând c erorile sunt aleatoare, probabilitatea p de succes a citiriituturor sectoarelor unui disc se calculeaz cu relaia:
512
8*512
11
C
BER p
−= . (9)
Atunci etalonul MTTDL corespunztor unei defeciuni a discului în RAID 5 iunei erori de bit în timpul refacerii discului se calculeaz cu relaia:
)1(*5 _ _
)1( −−=
N p N
MTBF R BER MTTDL . (10)
În cazul RAID 6, corespunztor defectrii a dou discuri i erorii de bit întimpul refacerii discului, acelai etalon se calculeaz cu relaia:
MTTR p N N
MTBF MTBF
R BER MTTDL N *)1(*)1(*10
*6 _ _
)2( −−−= . (11)
În final, etalonul MTTDL corespunztor fie unei cderi de disc, fie unei eroride bit este media armonic între MTTDL_DF i MTTDL_BER:
BER MTTDL DF MTTDL
MTTDL
_
1
_
11
+= . (12)
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
15/18
Tehnologia RAID: aplicaie de disk management 21
Etalonul MTTDL poate fi folosit la compararea fiabilitii diferitelor matricecu tipuri diferite de discuri, numr diferit de discuri i nivele diferite de RAID.
În concluzie, este important s se ia în seam faptul c fiabilitatea sistemuluinu depinde numai de fiabilitatea discurilor din sistem. În multe cazuri, sistemul deoperare este cel care cauzeaz pierderi de date. De asemenea, fiabilitatea depinde de
etalonul MTBF al altor componente, cum ar fi ventilatoarele sau sursele de curent,care, dac nu sunt înlocuite prompt, pot contribui la o cdere mai deas a sistemuluidecât discurile.
3. Descrierea aplicaiei
Aplicaia RAID ofer posibilitatea vizualizrii nivelelor RAID, calcululeficienei i fiabilitii acestora, precum i înelegerea modului de protecie a datelor.
Din meniul principal, se poate alege nivelul RAID i se poate calcula eficiena, pe baza numrului total de discuri disponibile, parametru introdus de utilizator.
Fig. 14. Meniul principal al aplicaiei RAID.
Nivelul RAID poate fi ales i un segment al unei matrice hibride, la care existde asemenea posibilitatea de a o vizualiza i de a-i calcula eficiena, dup cum se
poate observa în figura 14.Pentru nivelele RAID 5 i 6, exist opiunea de a calcula fiabilitatea matricei i
timpul mediu în care se pot pierde date dup defectarea unuia sau mai multor discuridin sistem, dup defectarea sistemului, sau dup erori de bit la citire. La alegereaopiunii de a calcula fiabilitatea, apare o nou fereastr , în care se pot alege parametrii
MTTF , MTTR, numrul de discuri din sistem, probabilitatea de citire a tuturor sectoarelor unui disc i caracteristicile defeciunii, iar dup procesarea parametrilor deintrare menionai se obin parametrii de ieire MTBF i MTTDL, dup cum se poateobserva în figura 15.
Pentru matricele RAID 2 i RAID 5, se poate alege opiunea deScriere/Refacere date, la alegerea creia apare o nou fereastr . La RAID 2, seobserv modul de detecie al erorii folosind codul Hamming corector de o eroare,dup cum se poate observa în figura 16. Pentru matricea RAID 5, se explic modul de
calcul al paritii i modul de rescriere al datelor în cazul defectrii unui disc, dupcum se poate observa în figura 17.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
16/18
Tehnologii i echipamente multimedia – lucrri practice22
Fig. 15. Fereastra Fiabilitate.
Fig. 16. Scrierea/Refacerea datelor la RAID 2.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
17/18
Tehnologia RAID: aplicaie de disk management 23
Fig. 17. Scrierea/Refacerea datelor la RAID 5.
4. Desf urarea lucrrii
1. Se verific dac este instalat pe calculator programul RAID. Dac aplicaianu este instalat, atunci se va instala din Setup. Se va lansa în execu ieaplicaia. (Calea default este: C:\Program Files\UPB\NivRAID\).
2. Se calculeaz eficiena fiecrui nivel RAID pentru 4 valori distincte alenumrului de discuri. Se noteaz datele într-un tabel.
3. Se compar fiabilitatea nivelelor RAID 5 i RAID 6 pentru aceleai datede intrare de la punctul 2. Se observ i se noteaz dependena fiabilitiifa de numrul de discuri.
4. Se observ modul de control al erorilor pentru nivelele RAID 2 i 5.4.1. Se calculeaz biii codului Hamming corector de o eroare în cazul
RAID 2. Se observ ce se întâmpl la introducerea unui bit eronat,apoi la introducerea a doi bii eronai.
4.2. Pentru RAID 5, se calculeaz pe hârtie paritatea cu funcia XOR între3 iruri de bii alese, apoi se reconstruiete unul din acestea folosind
biii de paritate.
-
8/19/2019 Tehnologia RAID: Aplicatie De Disk Management
18/18
Tehnologii i echipamente multimedia – lucrri practice24
5. Întrebri
1. Care este diferena între nivelele RAID 4 i RAID 5? Dar între RAID 5 iRAID 6?
2. De ce nu se mai folosete nivelul RAID 2?
3. Cum se calculeaz biii de control cu codul Hamming i cum se poatedetecta bitul introdus greit?
4. Care nivel RAID are o mai bun toleran la defecte?5. Care dintre nivelele RAID 0+1 i 10 este mai bun din punct de vedere al
performanei? Care dintre acestea prezint o toleran mai bun la defecte?6. Cum se actualizeaz datele de paritate pentru sistem RAID 5?7. Cum se refac datele pierdute de pe un disc dintr-o matrice RAID 5?8. Care este timpul mediu de pierdere a datelor pentru matricea RAID 5,
tiind c fiabilitatea unui disc este de 100.000 ore?9. Dar fiabilitatea matricei RAID 6 în acelai caz?10. Cum influeneaz probabilitatea erorii de bit durata în care se pot pierde
date?