Awarie RAIDu

Rozwiązania RAID stają się coraz bardziej popularne ze względu m.in. systematycznie spadające koszty tego typu rozwiązań. Serwery Qnap, bazodanowe,  czy macierze programowe są coraz bardziej dostępne dla zwykłego użytkownika. Również dostępność dysków SSD znacznie zmodyfikowała podejście ludzi do tego typu rozwiązań. Jednak trzeba tu zaznaczyć, że system RAID jest stanowczo bardziej niezawodny niż pojedynczy dysk (oprócz poziomu 0, który zwyczajnie rozdziela równolegle dane pomiędzy dyskami), jednak nie jest niezawodny w 100%. Wynika to z zastosowania wielu dysków, a dzięki zastosowaniu parzystej nadmiarowości, macierz jest odporna w przypadku awarii jednego lub więcej dysków (w zależności od konfiguracji – oprócz RAID 0). W razie awarii odtworzenie danych z uszkodzonego dysku, może zostać wykonane przy użyciu informacji, tworzonych podczas procesów zapisu.

Jednak nie zostało jeszcze stworzone rozwiązanie niezawodne, które ochroni nas użytkowników w stu procentach. Oto kilka rad – nasz dekalog – dzięki, któremu możesz uniknąć sporych kłopotów związanych z danymi przechowywanymi w RAIDzie:

Po pierwsze – systemy RAID nie są odporne na utratę danych. Owszem Systemy RAID zmniejszają ryzyko utraty danych, ale nie zabezpieczają ich w stu procentach.

Po drugie – RAID może działać z uszkodzonym jednym dyskiem… ale tylko w przypadkach , zapewniających nadmiarowość (poza RAID 0). Macierze takie są odporne na awarię jednego dysku . Jednak przy awarii tego jednego dysku lepiej nie zwlekać, ponieważ..

..ponieważ RAID nie jest odporny na awarię dwóch (lub więcej) dysków. Większość najpopularniejszych konfiguracji, nie ochroni przed utratą danych jeśli dwa dyski na raz ulegną awarii. (oprócz RAID 6- zapewniająca podwójną parzystość). Niestety podwójna nadmiarowość znacznie zmniejsza szybkość działania macierzy i zwiększa koszty. Wybór konfiguracji musi być, więc racjonalną równowagą między szybkością a bezpieczeństwem.

Po trzecie – Wymiana zepsutego dysku jak najszybciej. Bardzo często macierz RAID zbudowana jest z dysków, tego samego typu, a nawet z tej samej serii produkcyjnej, co bardzo ułatwia konfigurację i wyliczenia pojemności. Jednak biorąc pod uwagę współczynnik MTBF- Średni czas między awariami, który podaje Producent –  zwiększa prawdopodobieństwo, że jeśli jeden dysk uległ awarii, niedługo awarii mogą ulec pozostałe. Należy uszkodzony dysk wymienić jak najszybciej, najlepiej używając identycznego dysku (pojemność, szybkość), jak pozostałe. Przy operacji wymiany dysku nie należy posługiwać się dyskiem, który już był częścią jakiejś innej macierzy. Może to spowodować katastrofalne skutki przy odbudowie. Wymiana uszkodzonego dysku w macierzy RAID powinna się odbyć z udziałem przeszkolonej osoby lub informatyka, aby uniknąć błędów podczas tej operacji.

Po czwarte – Warto nadzorować rekonstrukcję danych w macierzy. Po wymianie dysku konieczna jest rekonstrukcja RAID, tak żeby nowy dysk mógł przejąć funkcje uszkodzonego.  Niestety pamiętać trzeba, że operacja odbudowy, jest obciążona  szczególnym ryzykiem i nie powinna być przeprowadzana, bez zapewnienia sobie aktualnego i sprawnego backupu. Podczas obudowy system jest szczególnie obciążony i podatny na błędy. Jak wspominaliśmy nierzadko może nastąpić awaria kolejnego nośnika podczas odbudowy i co? Tracimy dostęp do danych.. Wtedy Ważne jest piąte..

Po piąte – właściwe oznaczenie dysków w macierzy. Warto w tym miejscu zaznaczyć, że każdy z dysków współ stanowiących macierz RAID ma swoje miejsce w macierzy i specyficzne zadania. Fizyczne oznaczenie dysków pozwoli szybko ustalić ich rzeczywistą lokalizację w macierzy w przypadku awarii. Ustalenie kolejności dysków jest ważne w przypadku konieczności wysłania macierzy do laboratorium odzyskiwania danych. Niby w nowoczesnych macierzach dyski tworzące RAID przechowują informacje na temat nich samych, ale może się zdarzyć, że te dane zostaną uszkodzone lub nadpisane, wtedy oznaczenie dysków bardzo pomoże w rekonstrukcji macierzy w laboratorium.

Po szóste – nie próbuj naprawy macierzy w przypadku uszkodzenia danych. Czasem przerwa w zasilaniu, problemy systemowe lub działania użytkowników mogą uszkodzić dane lub spowodować, że nie będzie do nich dostępu. Lepiej wystrzegać się, w takim wypadku, korzystania z wbudowanych funkcji naprawy. Powodują one często dalsze uszkodzenia danych przeprowadzając sobie tylko znane, operacje zapisu, co może utrudnić później proces odzyskiwania danych.

Po siódme – Jak najszybciej wyłącz system! Jeżeli dane zostały utracone w wyniku przypadkowego usunięcia, natychmiast odłącz system od zasilania. Każda chwila zwłoki może spowodować nadpisanie danych tam, gdzie znajdowały się informacje, które chcemy odzyskać. Sytuacja przedstawia się podobnie w przypadku fizycznego uszkodzenia. Jeśli zauważysz dziwne zachowania systemu, podejrzane dzwięki podczas degradacji macierzy, lepiej od razu ją wyłączyć .

Po ósme. W przypadku awarii. Nie używaj funkcji “opcje domyślne”. W przypadku usterki macierzy, nie przywracaj “opcji domyślnych” – spowoduje to zmianę konfiguracji, nadpisanie danych i w konsekwencji –  ich utratę.

Po dziewiąte. Korzystanie z pomocy producenta sprzętu. Pomoc producenta nastawiona jest na przywrócenie sprawności macierzy, a nie na odzyskanie danych. Dwa razy się zastanów , zanim z niej skorzystasz. Łatwo w ten sposób odzyskać sprawną macierz a utracić dane.

Po dziesiąte. Jak już stracisz dane.  W tym miejscu chciałbym nadmienić, że macierz jest złożonym systemem wielodyskowym i rozmieszczenie danych wygląda zupełnie inaczej niż w pojedynczym dysku. Mają one złożoną strukturę logiczną, a same macierze mają często indywidualną strukturę fizyczną dostosowaną do potrzeb użytkownika.

Po Jedenaste – W przypadku macierzy raid na dyskch SSD, zwróć uwagę na fakt, że jeśli jeden dysk SSD uległ uszkodzeniu to reszta ma pewnie już podobne problemy. Dyski SSD mają niestety ograniczoną ilość zapisów na komórkę co sprawia, że należy je wymieniać partiami.

Wszystko to determinuje możliwości odzyskania danych z macierzy. Generalnie odzyskanie danych z RAID jest możliwe, ale determinuje je podejście użytkownika do problemu. Bardzo ważne są pierwsze kroki i wybór odpowiedniego specjalisty, który dysponując odpowiednimi narzędziami programistycznymi będzie w stanie rozwiązać nietypowe zadania jakie stawia przed nim indywidualny zespół bazodanowy.

przeczytaj również: