RAID Spares

Apollon Koutlidis apollon at planewalk.net
Mon Feb 22 16:47:57 EET 2010


On 22/02/10 14:21, Papaioannou Giannis wrote:
> Quoting Apollon Koutlidis <apollon at planewalk.net>:
>
>> On 22/02/10 09:50, Christos Ricudis wrote:
>>> "hot spare" einai o spare diskos pou brisketai online, wste otan 
>>> er8ei h wra na antikatasthseis ayton poy molis sou xtyphse, na exeis 
>>> mia eksisou sobarh pi8anothta na exei xtyphsei ki aytos (to failure 
>>> rate twn diskwn einai synarthsh tou xronou leitourgias tous)
>>
>> Η εκτεταμένη έρευνα που διεξήγαγαν οι κύριοι του γούγλη διαφωνεί μαζί 
>> σου:
>>
>> "Overall, we expected to notice a very strong and consistent 
>> correlation between high utilisation and higher failure rates. 
>> However our results appear to paint a more complex picture. First, 
>> only very young and very old age groups appear to show the expected 
>> behaviour." [1]
>
> Όταν έχεις 10 συστήματα στο χώρο εργασίας σου, τότε σε συμφέρει να 
> έχεις 2
> spare δίσκους σφραγισμένους στο συρτάρι σου. Όταν έχεις 100 συστήματα
> διασκορπισμένα σε όλη την χώρα, σε συμφέρει να έχεις έναν hotspare σε 
> κάθε
> σύστημα, γιατί η πιθανότητα να βρεις άτομο να κάνει την αντικατάσταση 
> έγκαιρα
> και με τον δίσκο να είναι διαθέσιμος χωρίς να έχει καταλήξει στο pc του
> υπαλλήλου που κάνει καθημερινά τοπικό backup το youporn, είναι αρκετά 
> μικρότερη
> από την διπλή αστοχία υλικού στο ίδιο σύστημα.

Και πάλι εξαρτάται - σενάριο:

Έχεις στο "χώρο εργασίας σου" ένα server με RAID5 array αποτελούμενο από 
έξι spindles του ενός TB το καθένα. Όταν (και όχι "αν") χάσεις ένα 
spindle, μετά την αντικατάστασή του θα χρειαστούν πολλές (ίσως και πάρα 
πολλές ανάλογα το hardware) ώρες για το rebuild. Μέχρι τη στιγμή που θα 
τελειώσει το rebuild είσαι εκτεθειμένος στην πιθανότητα απώλειας 
δεδομένων στην περίπτωση που χαθεί και δεύτερο spindle.

Ας υποθέσουμε τώρα ότι είναι Παρασκευή 29 Δεκεμβρίου, 17:45. Όλος ο 
κόσμος έχουνε πάει στα σπίτια τους και ετοιμάζονται για το 
πρωτοχρονιάτικο τετραήμερο. Και ένας καταραμένος από τους 6 SATA WD 
αποφασίζει να τα κακαρώσει... έχεις τουλάχιστον 112 ώρες ρίσκου μέχρι 
την ώρα που θα πάει κάποιος στο γραφείο να αλλάξει το δίσκο. Και άλλες 
50 ώρες πιθανότατα μέχρι να τελειώσει το resync. Δευτέρα κοντά μεσάνυχτα 
εγκαταλείπει τα εγκόσμια και δεύτερος δίσκος. Αποχαιρέτα τα 100+ Inboxes 
που χάνεις... Ένα hot spare θα κόστιζε άλλα €200. Τα δεδομένα που 
χάθηκαν τι κόστος επιφέρουν;

Ένας ακόμα συντελεστής θα μπορούσε να είναι η περίπτωση που η εν λόγω 
επιχείριση δεν έχει full-time sysadmin και πρέπει να ειδοποιηθεί κάποιος 
να έρθει να αντικαταστήσει τον δίσκο, εισάγοντας ακόμα μεγαλύτερες 
καθυστερήσεις.

Συμπέρασμα - που θα έπρεπε να είναι προφανές αλλά δυστυχώς δεν είναι: 
Όταν τα δεδομένα σας αξίζουν πολύ περισσότερο από τους 1-2 έξτρα δίσκους 
και ίσως επιπλέον HBAs, "κάλλιο γαϊδουρόδενε".

Φιλικά,

Απόλλων



More information about the Linux-greek-users mailing list