|
1.RAID Přehled
V roce 1988 navrhla Kalifornská univerzita v Berkeley koncept RAID (RedundantArrayofInexpensiveDisks Levná redundantní disková pole), s neustálým snižováním ceny disků se z RAID stalo (Redundant Array of Independent Disks Nezávislé disky), ale podstata se nezměnila. SNIA, Berkeley a další organizace stanovily sedm úrovní RAID0~RAID6 jako standardní úrovně RAID a standardní RAID lze kombinovat do dalších úrovní RAID, přičemž v praxi se nejčastěji používají úrovně RAID0, RAID1, RAID3, RAID5, RAID6 a RAID10. Každá úroveň představuje způsob implementace a technologii a mezi jednotlivými úrovněmi není žádný rozdíl. V praktických aplikacích by měl uživatel zvolit vhodnou úroveň RAID a konkrétní metodu implementace podle vlastností datové aplikace s ohledem na dostupnost, výkon a náklady.
Z hlediska implementace se RAID dělí hlavně na měkký RAID, tvrdý RAID a měkký a tvrdý hybridní RAID tři. Měkký RAID má všechny funkce prováděny operačním systémem a procesorem, což je přirozeně nejméně efektivní. Hard RAID je vybaven speciálním řídicím/zpracovávacím čipem RAID a čipem pro zpracování I/O a vyrovnávací pamětí pole, nezabírá prostředky procesoru, ale náklady jsou velmi vysoké. Měkký a tvrdý hybridní RAID je vybaven řídicím/zpracovávacím čipem RAID, ale postrádá čip pro zpracování I/O, který potřebuje k dokončení procesor a ovladač, výkon a náklady jsou mezi měkkým a tvrdým RAID.
2. Základní princip
RAID je diskový subsystém sestávající z několika nezávislých vysoce výkonných diskových jednotek, který poskytuje vyšší úložný výkon a redundanci dat než jediný disk. RAID je třída technologie správy více disků, která poskytuje hostitelským prostředím vysoce výkonné úložiště při mírných nákladech a vysoké spolehlivosti dat. dvěma hlavními cíli RAID jsou zlepšení spolehlivosti dat a výkonu I/O. V diskovém poli jsou data rozložena na více disků, ale pro počítačový systém se chovají jako jediný disk. Redundance se dosahuje zápisem stejných dat na více disků současně (typicky např. zrcadlení) nebo zápisem vypočtených kontrolních součtů dat do pole, u nichž lze zaručit, že při selhání jednoho disku nedojde ke ztrátě dat.
V RAID existují tři hlavní klíčové koncepty a technologie: zrcadlení (Mirroring), prokládání dat (DataStripping) a ověřování dat (Dataparity):
Zrcadlení, kopírování dat na více disků, může na jedné straně zvýšit spolehlivost a na druhé straně může současně číst data ze dvou nebo více kopií a zvýšit tak výkon čtení. Je zřejmé, že výkon zápisu při zrcadlení je o něco nižší a zajištění správného zápisu dat na více disků vyžaduje větší časovou náročnost. Prokládání dat, při kterém jsou datové řezy uloženy na více různých discích a více datových řezů dohromady tvoří kompletní kopii dat, se liší od zrcadlení více kopií a často se používá z důvodu výkonu. Prokládání dat má vyšší granularitu souběhu a umožňuje velmi výrazné zvýšení I/O výkonu při přístupu k datům současným prováděním operací čtení a zápisu na data umístěná na různých discích. Validace dat, detekce a oprava chyb v datech s využitím redundantních dat, která se obvykle počítají pomocí algoritmů, jako je Hemmingův kód a heteroskedastické operace k získání. Spolehlivost, robustnost a odolnost diskových polí proti chybám lze výrazně zlepšit použitím funkce kontrolního součtu. Kontrolní součty dat však vyžadují čtení dat z více míst a provádění výpočtů a porovnávání, což může ovlivnit výkon systému. Různé úrovně RAID používají jednu nebo více z těchto tří technik k dosažení různé spolehlivosti dat, dostupnosti a výkonu I/O. Pokud jde o to, jaký typ RAID navrhnout (nebo dokonce novou úroveň či typ) nebo jaký režim RAID použít, je nutné provést rozumnou volbu na základě důkladného pochopení požadavků na systém a provést kompromisní volbu komplexním vyhodnocením spolehlivosti, výkonu a nákladů.
Celkově lze říci, že hlavními výhodami RAID jsou: vysoká kapacita, vysoký výkon, spolehlivost, spravovatelnost.
3.Úroveň RAID
JBOD (JustaBunchOfDisks) není standardní úrovní RAID, obvykle se používá pro označení souboru disků bez řídicího softwaru, který zajišťuje koordinované řízení. jBOD bude několik fyzických disků v sérii, aby poskytly obrovský logický disk. Výkon úložiště je přesně stejný jako u jednoho disku a není zajištěna žádná ochrana dat. Dostupná úložná kapacita se rovná součtu úložného prostoru všech členských disků.
RAID 0 se nazývá striping a je to jednoduchá technika prokládání dat bez kontrolních součtů dat. Výkon je nejvyšší ze všech úrovní RAID. Neposkytuje žádnou formu strategie redundance. 100 % úložného prostoru je využito.
RAID 1 se nazývá zrcadlení, které zapisuje data na pracovní a zrcadlené disky odděleně stejným způsobem. má 50% využití diskového prostoru. Při zápisu dat dochází k ovlivnění výkonu, ale při čtení dat k ovlivnění nedochází. Poskytuje nejlepší ochranu dat, v případě poruchy pracovního disku systém automaticky načte data ze zrcadleného disku, aniž by byla ovlivněna práce uživatele.
RAID2 se nazývá Hemming Code Array a jeho konstrukční myšlenkou je použití Hemming Code k dosažení redundance kontrolních součtů dat. Čím větší je šířka dat, tím vyšší je míra využití úložného prostoru, ale současně je také vyšší počet potřebných disků. Má vlastní schopnost opravy chyb, nicméně režie redundance dat Hemmingova kódu je příliš velká a rekonstrukce dat je časově velmi náročná, proto se RAID2 v praxi používá jen zřídka.
RAID3 se nazývá vyhrazený paritní proužek, který používá vyhrazený disk jako paritní disk a ostatní disky jako datové disky a data jsou křížově ukládána do různých datových disků bitovým způsobem. RAID3 vyžaduje nejméně tři disky.
RAID4 je zhruba stejný princip jako RAID3. Poskytuje velmi dobrý výkon při čtení, ale horší výkon při zápisu. A s rostoucím počtem členských disků se více projeví úzké místo systému v podobě kontrolního disku. V praktických aplikacích se vyskytuje zřídka a běžné úložné produkty ochranu RAID4 používají jen zřídka.
RAID5 se nazývá Distributed Parity Stripe (distribuovaný paritní proužek), který by měl být v současnosti nejběžnější úrovní RAID. Princip je podobný jako u RAID4, ale v RAID4 není problém s úzkým místem výkonu kontrolního disku při souběžných operacích zápisu.
RAID6 se nazývá double parity stripe, který zavádí koncept dvojité parity pro řešení problému integrity dat při selhání dvou disků současně, který nelze vyřešit jinými úrovněmi RAID. Jeho cena je však mnohem vyšší než u RAID5, výkon zápisu je také horší a návrh a implementace jsou velmi složité. Proto se RAID6 v praxi používá jen zřídka a je obecně ekonomickou alternativou k řešení RAID10.
Standardní úrovně RAID mají své silné a slabé stránky. Kombinací více úrovní RAID lze dosáhnout vzájemně se doplňujících výhod a kompenzovat nedostatky, čímž se dosáhne vyššího výkonu, bezpečnosti dat a dalších ukazatelů systému RAID. Samozřejmě, že náklady na kombinování úrovní RAID jsou obecně velmi nákladné a používají se pouze v několika specifických aplikacích. Široké uplatnění mají pouze RAID01 a RAID10.
RAID01 je prokládání a následné zrcadlení, které v podstatě zrcadlí fyzické disky, zatímco RAID10 je zrcadlení a následné prokládání, které zrcadlí virtuální disky. Při stejné konfiguraci má RAID01 obvykle lepší odolnost proti chybám než RAID10. RAID01 kombinuje výhody RAID0 a RAID1 a celková míra využití disků je pouze 50 %.
4. Srovnání hlavních úrovní RAID
Konfigurace RAID
Úroveň/popis | Tolerance poruch | Klady | Nevýhody |
RAID 0 Mapuje data napříč disky a vytváří velké virtuální disky. Protože každý fyzický disk zpracovává pouze část požadavků, může poskytovat vyšší výkon. Selhání jedné jednotky však způsobí, že virtuální disk (VD) bude nedostupný a data budou trvale ztracena.
| Ne | Lepší výkon Další úložiště | Nepoužívat pro kritická data |
RAID 1 zrcadlí data a ukládá je redundantně na dvě jednotky. Pokud jeden disk selže, druhý disk převezme jeho roli a bude fungovat jako primární.
| Chyba disku Selhání jednoho disku | Vysoký výkon při čtení Rychlé obnovení po selhání disku Redundance dat | Vysoká režie disku Omezená kapacita |
RAID 5 mapuje data napříč disky a paritní bit každého datového proužku ukládá na jiný disk ve VD. Paritní bity obsahují informace, které lze v případě selhání jednoho disku použít k obnovení dat z poškozeného disku z jiných disků.
| Chyba disku Selhání jednotlivého disku | Efektivní využití kapacity disku Vysoký výkon při čtení Středně vysoký výkon zápisu | Střední dopad selhání disku Delší doba obnovy kvůli přepočítané paritě |
RAID 6 mapuje data napříč disky a ukládá paritní bity pro každý datový proužek na jiný disk ve VD. Na rozdíl od pole RAID 5 provádí pole RAID 6 dva výpočty parity (P a Q), takže je odolné proti selhání dvou disků.
| Redundance dat Vysoký výkon při čtení | Chyby disku Selhání dvou disků | Snížený výkon zápisu kvůli dvěma paritním výpočtům Dodatečné náklady v důsledku použití ekvivalentu dvou disků pro paritu |
RAID 10 Striping na zrcadlených sadách. Režie disku je vysoká, ale je to vynikající řešení pro potřeby vysokého výkonu, redundance a rychlé obnovy v případě selhání disku.
| Chyby disku Selhání jednoho disku na sadu zrcadel | Vysoký výkon při čtení Podpora sad RAID s až 192 disky | Nejvyšší náklady | RAID 50 Prokládání v sadách RAID 5. Výkon RAID 5 lze v závislosti na konfiguraci zvýšit snížením počtu čtení disků na výpočet parity.
| Chyby disků Jedno selhání disku na rozpětí | Vysoký výkon při čtení Střední až vysoký výkon zápisu Podpora skupin RAID s až 192 disky | Střední dopad selhání disku Delší doba obnovy kvůli přepočtu parity |
RAID 60 Striping na sadách RAID 6. Výkon lze u sad RAID 6 zvýšit snížením počtu čtení disků na výpočet parity, v závislosti na konfiguraci.
| Chyby disku Dvě selhání disku v jednom rozpětí | Vysoký výkon při čtení Podpora skupin RAID s až 192 disky | Snížený výkon zápisu kvůli dvojitým výpočtům parity Dodatečné náklady v důsledku použití ekvivalentu dvou disků pro paritu |
5. Rozdíly v hardwaru a softwaru RAID
Soft RAID
Soft RAID nemá vyhrazený čip řadiče ani I/O čip, implementace funkcí RAID je zcela v kompetenci operačního systému a procesoru. Moderní operační systémy v podstatě poskytují podporu soft RAID přidáním softwarové vrstvy k ovladači diskového zařízení, která poskytuje abstrakční vrstvu mezi fyzickými a logickými disky. V současné době jsou nejběžnějšími úrovněmi RAID podporovanými operačními systémy RAID0, RAID1, RAID10, RAID01 a RAID5. Například Windows Server podporuje RAID0, RAID1 a RAID5, Linux podporuje RAID0, RAID1, RAID4, RAID5, RAID6 atd. a operační systémy jako Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris atd. rovněž podporují odpovídající úrovně RAID. operační systémy jako Mac OS X Server, FreeBSD, NetBSD, OpenBSD, Solaris atd. rovněž podporují odpovídající úrovně RAID.
Správa konfigurace a obnova dat soft RAID jsou poměrně jednoduché, ale zpracování všech úloh RAID je kompletně prováděno procesorem, například výpočet paritní hodnoty, takže účinnost provádění je poměrně nízká a tato metoda vyžaduje velké množství výpočetních prostředků a je obtížné ji široce používat, protože je podporováno méně režimů RAID.
Soft RAID je implementován operačním systémem, takže oddíl, kde je umístěn systém, nelze použít jako logický členský disk RAID a soft RAID nemůže chránit systémový disk D. Pro některé operační systémy není RAID dobrou volbou. U některých operačních systémů jsou informace o konfiguraci RAID uloženy v systémových informacích, nikoli v samostatném souboru na disku. Při neočekávaném pádu systému a nutnosti jeho přeinstalace tak dojde ke ztrátě informací o RAID. Kromě toho technologie odolnosti disků proti chybám není totéž co plná podpora výměny online, výměny za provozu nebo výměny za tepla; schopnost podporovat výměnu disků za provozu při chybách souvisí s implementací operačního systému a některé operační systémy výměnu za tepla podporují.
Pevný RAID
Hard RAID má vlastní čip pro zpracování řízení RAID a zpracování I/O a dokonce i vyrovnávací paměť pole, obsazení procesoru a celkový výkon je ze všech tří typů implementací nejlepší, ale náklady na implementaci jsou také nejvyšší. Hard RAID obvykle podporuje technologii hot-swap, která umožňuje vyměnit vadné disky za chodu systému.
Hard RAID se skládá z karty RAID a čipu RAID integrovaného na základní desce a serverové platformy většinou používají karty RAID. Karta RAID se skládá ze čtyř částí: procesorového čipu jádra RAID (CPU na kartě RAID), portů, mezipaměti a baterie. Port označuje typ diskového rozhraní podporovaného kartou RAID, například IDE/ATA, SCSI, SATA, SAS, FC a další rozhraní.
Smíšený pevný a měkký RAID
Soft RAID má nízký výkon a nechrání systémové oddíly, což ztěžuje jeho použití ve stolních systémech. Hard RAID je velmi drahý a různé RAIDy jsou na sobě nezávislé a nejsou interoperabilní. Proto se k implementaci RAID používá kombinace softwaru a hardwaru, aby se dosáhlo kompromisu mezi výkonem a náklady, tj. lepšího poměru cena/výkon.
Tento druh RAID sice využívá řídicí čip pro zpracování, ale v zájmu úspory nákladů je tento čip často relativně levný a má slabý výpočetní výkon, zpracování úloh RAID stále většinou provádí procesor prostřednictvím ovladače firmwaru.
6.Výběr aplikace RAID
Při výběru úrovně RAID existují tři hlavní faktory: dostupnost dat, vstupně-výstupní výkon a náklady. Pokud není vyžadována dostupnost, zvolte RAID 0 pro vysoký výkon. Pokud je důležitá dostupnost a výkon a náklady nejsou hlavním faktorem, pak podle počtu disků zvolte RAID 1. Pokud jsou dostupnost, náklady a výkon stejně důležité, pak podle obecného přenosu dat a počtu disků zvolte RAID 3 nebo RAID 5. V praxi se podle charakteristik datové aplikace uživatele a konkrétních okolností komplexního zvážení dostupnosti, výkonu a nákladů zvolí vhodná úroveň RAID. Úroveň RAID. |
Předchozí: Pravidelné zálohování vzdálené databáze MySQL v prostředí LinuxDalší一篇:Docker MySQL řeší problém s příliš mnoha připojeními
|