| Bezpečnost paměťových médií se často přeceňuje |
|
|
|
|
Autorem odborného článku je Štěpán Mikeš, záchrana a obnova dat Datahelp.cz Máte pocit, že jsou vaše data a soubory v bezpečí a náhlá ztráta jim nehrozí? Pravidelně zálohujete, nakládáte opatrně se svým puštěným notebookem, externí disk nebo usb flash kartu řádně odhlašujete předtím, než ji vyndáte z USB slotu počítače? Přesto čtěte dál, budete překvapeni. V následujícím článku probírá odborník na záchranu a obnovu dat Štěpán Mikeš běžné problémy dnešních datových médií. V dnešní době jsme svědky celkem zajímavého vývoje. Přibývá nemechanických paměťových médií (SSD disky, flash paměti a karty) a v řadě oblastí masově nahrazují klasické pevné disky nebo optická paměťová média. Díky tomu, že jsou nemechanická, řada lidí nabývá dojmu, že jsou méně poruchová a že data na nich uložená jsou tudíž ve větším bezpečí. Částečně je to pravda, protože je nemůžou potkat např. mechanické poruchy běžné pro klasické pevné disky. Na druhou stranu jde o novou technologii a princip ukládání dat, který má ještě stále řadu nedořešených „dětských nemocí“ Za druhé pak z principu svého fungování trpí zcela jinými typy poruch. Ty zase naopak nikdy nenastanou u klasických pevných disků. Z role „mechanického“ opraváře se proto v současné době specialisté na záchranu dat učí stále častěji překonávat a vyvíjet složité algoritmy pro šifrování, dešifrování a opětovné skládání různě rozmístěných dat. Musí zvládat výpočetně velmi náročné operace. Z pohledu vyšší bezpečnosti dat uložených v těchto médiích je to tedy tak trochu na vážkách. Žádný revoluční průlom se z hlediska trvanlivosti dat rozhodně nekoná. SSD disky a flash paměti rozhodně nejsou bez poruch
Jaké jsou časté závady u SSD a flash pamětí? Především jde o selhání řídícího čipu, ve kterém je zapsán algoritmus a jeho parametry. Většinou není problém přečíst jednotlivé informace, které paměťové čipy obsahují. Problémem je až následná analýza přečtených informací a jejich složení zpět do smysluplné podoby. Tyto úkony jsou nesmírně náročné především z pohledu výpočetního výkonu. Operace trvá dlouho. Základem úspěšné záchrany dat je tedy porozumět co možná nejvíce algoritmům práce s ukládáním dat od různých výrobců. Oproti klasickým diskům se potom liší i způsob, jakým se data na médium ukládají. Klasické disky do paměťové buňky na plotně zapíšou požadovanou hodnotu bez ohledu na předchozí hodnotu, u SSD disku se musí nejprve paměťová buňka "vynulovat". Poté je možné novou informaci zapsat. Nejnovější SSD disky to dnes řeší příkazem trim. Občas se ale stane, že se při jeho chybném použití spustí velmi rychlý proces smazání všech dat na SSD. Záludnost spočívá v tom, že pokud se tento proces spustí, nelze jej nijak přerušit a nulování paměťových buněk pokračuje při každém následném zapnutí SSD. Takováto selhání SSD jsme zatím řešili jen ojediněle a výrobce velmi rychle vydal opravu příslušného firmware. Každopádně představa, že by tento mechanizmus využili tvůrci virů, je poměrně děsivá. U pevných disků jsou nejčastější mechanické závady
U disků dochází k selhání jak elektronických, tak mechanických částí. Jako jedni z mála v ČR (možná i jediní) umíme řešit např. problém zadřených ložisek u disků Seagate a další těžší mechanická poškození u disků WD. Je důležité dobře rozumět hlavně mechanice a fyzikálním principům fungování disků. Když dobře znáte nebo objevíte nové mechanizmy, jak to uvnitř disku funguje, zvýšíte pravděpodobnost, že se data podaří zachránit. I přes různá řešení parkování hlav při pádu jsou např. disky stále citlivé na otřesy. Je potřeba si dávat pozor hlavně na jakoukoliv hrubější manipulaci s diskem za chodu. To bývá problém především u notebooků. S nástupem disků s velkou kapacitou se také začíná objevovat na první pohled paradoxní příčina závad - malý objem uložených dat. Pokud je na TB disku uloženo například jen 10 – 20 GB intenzivně používaných dat, pak je používána jen velmi malá část celkové kapacity ploten. V praxi se pak setkáváme s poruchami disků, které mají vadný povrch plotny právě v těchto místech. Ta místa jsou fyzicky nadměrně využívaná, po čase logicky odejdou. V posledních letech došlo také k výraznému přepracování architektury firmware a korekce chyb. Firmware moderních disků není již celý uložen v eprom elektroniky, ale je částečně zapsán na plotnách disku. Toto řešení snižuje cenu disku a od kapacit 1TB je vzhledem k velikosti servisních dat nutností. Nese to však rizika. Chyba v mechanizmu relokace vadných bloků byla příčinou např. častého selhávání disků Seagate řady 7200.11. V určité kombinaci firmware u těchto disků došlo k nekorektnímu zápisu do chybových tabulek. Disk se stal nefunkčním. Jak poruchové jsou jednotlivé značky pevných disků? Tabulka uvádí poruchovosti disků ze statistik provedených záchran dat u společnosti Datahelp za posledních 5 let. Výsledek ovlivňuje počet prodaných disků jednotlivých výrobců. WD a Seagate jsou nejprodávanější, proto mají statisticky i nejvíce poruch. Poslední dobou přibývá poruch u disků Samsung. Souvisí to opět s tím, že se ve větším množství začaly prodávat až poslední 2 roky. Samsung 5% Životnost moderních disků je dle našich zkušeností cca 2-3 roky. To je daň především za vysoké hustoty zápisu a kapacity v řádu TB. Je potřeba na to pamatovat a po uplynutí této doby disk uložit do archivu. Nebo si pro jistotu pořídit ještě jeden a opravdu důležitá data si na něj pravidelně archivovat. Řešení poruch diskových polí RAID je náročnou specialitou U diskových polí RAID dochází ke ztrátě dat z několika důvodů. Největší problém se v poslední době ukazuje lidský faktor. Buď se pořádně nedělají zálohy, aktuální administrátoři neznají všechny potřebné informace o systému nebo svým špatným rozhodnutím či opomenutím nechají dojít pole až ke kolapsu. Většinou jsou tyto havárie z řad kritických, protože mají v polích citlivá nebo důležitá data firmy. Jeden příklad za vše - U redundantních polí typu RAID 1, 5, 5ee, 6 je příčinou ztráty dat selhání více disků. V poli se porouchá první disk. Protože vše relativně funguje, technici se rozhodnout pole nechat běžet dál degradovaně a později vyměnit vadný disk. Potom na to ale zapomenou, a když v poli vypadne i další disk, nastane malér. Při záchraně dat z takového pole pak často řešíme problém, z čeho ho vůbec poskládat. Nejsou výjimky, že se z logů dozvíme, že RAID pole běželo déle jak několik měsíců v degradovaném režimu. Další příčinou ztráty dat z diskových polí je selhání jiné části HW než disku. Typicky je vadný řadič, který již není k dispozici. Pak je nutné pole složit pomocí jiných nástrojů. V takovém případě někdy zjišťujeme, že správce serveru ani neví, v jaké konfiguraci pole běželo. Případně se dozvíme, že před lety pole konfiguroval zaměstnanec, který již v dané firmě nepracuje a o tyto důležité informace se při odchodu s nikým samozřejmě nepodělil. V nedávné době se nám v laboratoři podařilo přijít na to, jakým způsobem podobné maléry řešit rychleji u některých typů diskových polí. Konkrétně to byly RAID pole SAS disků v serverech od HP (smart array). Přišli jsme na fígl, který celkový postup obnovy dat z diskových polí RAID dost urychlí. Díky určité optimalizaci algoritmu jsme tak v Datahelpu dobu opravy snížili asi o polovinu (z řádově 24 hodin na 12). V situaci, kdy firmě stojí díky poruše pole výroba nebo neprodává eshop, je to úspora k nezaplacení. A jedno důležité doporučení na závěr? Pokud si omylem smažete z média data nebo médium zformátujete, dá se to celkem spolehlivě vyřešit podomácku některým z dostupných programů na obnovu smazaných dat. Pokud se však jedná o mechanické nebo elektronické poruchy média, je vhodnější přenechat záchranu opravdu odborníkům. Zvlášť v případě, kdy vám na datech záleží. Neodborný zásah souseda „všeuměla“ totiž na datech často napáchá mnohem větší škody, než samotná původní porucha. Někdy jsou to škody fatální. |





















