Mijn HD in mijn Synology NAS is gecrashed – RAID 1 recovery

Ik krijg nogal eens vragen over het gebruiken en inzetten van een NAS binnen mature households / kleine bedrijfjes. Wat me vandaag overkwam (zie onder) is een goed voorbeeld om uit te leggen ‘hoe het dan werkt’ als een van de schijven in de NAS defect is (of om later naar te verwijzen) (bedoeld voor de lezer in die categorie die nieuw is rondom het begrip NAS).

Een NAS is een network attached storage, wat zoveel betekent dat je een stukje opslag in de vorm van een aantal harde schijven in een doosje aan je interne netwerk koppelt. Je kunt dan vanuit elke computer in je club die aangesloten is op het netwerk bij dezelfde bestanden.

Waar je wel rekening mee moet houden is dat de NAS zelf en ook de harde schijven een bepaalde levensduur hebben. Vaak levert een fabrikant een “gemiddelde tijd tussen falen” (MTBF) waarde mee in de beschrijving waarmee je betrouwbaarheid kunt berekenen (dit geldt overigens voor vrijwel alle apparaten).


hoe wapen je je tegen dataverlies?

Over het  algemeen zorg je ervoor dat alle onderdelen dubbel zijn uitgevoerd: In plaats van een apparaat plaats je er twee (redundantie). Daarnaast zorg je ervoor dat alle data voortdurend gesynchronizeerd wordt tussen de twee omgevingen. Op het moment dat er dan iets fout gaat kun je heel snel switchen. Voor grote omgevingen bij grotere bedrijven is vaak alles dubbel uitgevoerd tot en met de routers en kabels aan toe. Via een bepaalde (moeilijke) calculatie kun je dan berekenen hoeveel tijd je per jaar “down” bent.

Voor huishoudens en kleine bedrijfjes is het natuurlijk kosten technisch niet mogelijk om alles dubbel uit te voeren. Dat heeft als nadeel dat je, als het mis gaat, een langere tijd “down” bent, maar je neemt dat mee in je kosten overweging.

Waar je je op zijn minst tegen wilt wapenen is data verlies: je wilt niet dat er gegevens verloren gaan als er iets mis gaat.

1. backups

In de uitleg hier rondom loop ik er meestal tegenaan dat redundancy inbouwen iets te maken heeft met “backups”, dat is niet zo. Een backup is een copie van je gegevens. Er kan heel veel mis gaan buiten een storing op een specifiek onderdeel: je wilt altijd een of meerdere backups paraat hebben. Het is dus altijd sowiso belangrijk om backups te maken van je NAS. Ik heb zelf 2 externe harde schijven die ik regelmatig aan de NAS hang om er een backup op te draaien (en een aantal online storage accounts in de cloud). Je kunt zelf beslissen welke gegevens je vaker wilt backuppen dan andere, maar wees je er bewust ervan dat er altijd een moment komt dat alles kwijt bent (e.g. in dit geval als binnen de NAS een onderdeel alles kapot maakt). Ik heb zo vaak gezien dat er geen backup voorhanden was dat ik de tel ben kwijtgeraakt. Mensen hebben altijd spijt op dat moment en vinden het dan pas een stommiteit. Sterker nog: er zijn bedrijven die gewoonweg faiiet gaan, met als reden dat er geen backup voorhanden was (en er bijvoorbeeld langzaam data corruptie was opgetreden). Neem er even een rustig moment voor om een procedure op te stellen met een vinklijstje, zodat je weet wanneer er de laatste keer een backup is gedraaid. Ook binnen je huishouden, want het is ontzettend jammer als al je foto’s en video’s en documenten plotsklaps zouden verdwijnen (of nou juist de foto’s van de laatste 2 maanden…). Er zijn boeken vol te schrijven over advies rondom backup strategieen.

Maar… dit heeft dus weinig te maken met redundant uitvoeren.

2. redundantie inbouwen

Vanuit het budget gezien van een huishouden of klein bedrijfje wil je dat minstens je opslag redundant is uitgevoerd: als er dan een harde schijf crasht, ben je je data niet kwijt omdat die ergens anders nog aanwezig is. Hiervoor is een standaard bedacht die “RAID” heet (lees http://en.wikipedia.org/wiki/RAID), en waarvan allerlei variaties bestaan.

image

In het voorbeeld hier links zie je RAID 0 : alles wat in het cluster 1 gebeurd wordt gespiegeld op cluster 2. Dit betekent als een harde schijf in cluster 1 crasht je die data nog in cluster 2 hebt en dus alles de kapotte harde schijf moet vervangen.

Je kunt waarschijnlijk al bedenken dat er nog veel slimmere manieren bestaan om dit spiegelen te doen, zie daarvoor de wikipedia link hierboven waar diverse RAID niveau’s staan uitgelegd.

Voor mijn huishouden heb ik 6 jaar geleden, besloten om alles in simpelweg RAID 1 te draaien. Temeer omdat ik bij de stand van zaken rondom de standaard ondersteuning op mijn NAS destijds (en “what if”) daar het beste gevoel bij had.

Als er dan een dan een schijf kapot gaat hoef je simpelweg maar een nieuwe te bestellen en deze erin te plaatsen. Je kunt dan rustig verder werken op het andere volume.

 

Mijn actueel voorbeeld

Vanochtend hoorde ik “skrrrriiiiiiiii” vanuit mijn NAS en dat klinkt natuurlijk als een harde schijf die naar de knoppen is. Het eerste wat ik probeerde was een reboot en het ziet er naar uit dat het gaat om schijf #1 van volume 1 (oranje lampje + constante beep) (ik ben heel blij dat de GUI mij de beep laat uitzetten met een druk op de knop) :

image

Dit is de eerste schijf in mijn NAS die echt defect is, dus op zich vrij logisch na 6 jaar vrijwel voortdurend paraat staan. Ik heb nu dan ook de verwachting dat de andere harde schijven ook binnekort de geest geven.

Ik moet nu dus schijf nummer  1 gaan vervangen in volume 1 (maar kan ondertussen gewoon doorwerken), en dan via beheer > volume repararen het volume weer repareren. Je moet goed opletten dat de schijf die je vervangt “fysiek” in de NAS ook daadwerkelijk de schijf is die als zodanig genummerd wordt op het scherm ;)

Ik heb een nieuwe schijf gekocht, van ongeveer dezelfde grootte (van dezelfde leverancier) en heb deze in de NAS vervangen (in slot #1). Ik heb wederom gekozen voor een zuinig type. Ik had ook een 3 TB versie kunnen kopen maar in RAID 1 blijft het grootste gedeelte dan ongebruikt. Dus op dit moment is dat nog niet zo logisch en het scheelt bovendien 100 euro (en met bitcasa in het achterhoofd verwacht ik dat ik langzamerhand minder schijf ruimte in het huis zelf nodig zal hebben).

In de GUI van de NAS klik ik nu “repararen”: en hij gaat de nieuwe schijf initialiseren (rauw uit de verpakking is de schijf nog niet geinitialiseerd) en vervolgens het in RAID draaiende volume herstellen:

image

Deze herstelactie duurt dan eventjes (1 uur per 250GB in mijn geval) (maar je kunt dus ondertussen doorwerken op de NAS).

De defect schijf niet zomaar weggooien

Wat nu nog belangrijk is, is dat de ik defecte harde schijf wel “goed kapot” maak. Dat is belangrijk omdat theoretisch iemand de harde schijf bij het afval zou kunnen vinden en vervolgens via forensische methoden er toch nog allerlei data vanaf zou weten te plukken. However, ik leg de mijne nu gewoon op het stapeltje defecte en oude harde schijven zodat ik die eens allemaal in een keer defect kan maken.

Comments