RAID Spares
Apollon Koutlidis
apollon at planewalk.net
Mon Feb 22 16:47:57 EET 2010
On 22/02/10 14:21, Papaioannou Giannis wrote:
> Quoting Apollon Koutlidis <apollon at planewalk.net>:
>
>> On 22/02/10 09:50, Christos Ricudis wrote:
>>> "hot spare" einai o spare diskos pou brisketai online, wste otan
>>> er8ei h wra na antikatasthseis ayton poy molis sou xtyphse, na exeis
>>> mia eksisou sobarh pi8anothta na exei xtyphsei ki aytos (to failure
>>> rate twn diskwn einai synarthsh tou xronou leitourgias tous)
>>
>> Η εκτεταμένη έρευνα που διεξήγαγαν οι κύριοι του γούγλη διαφωνεί μαζί
>> σου:
>>
>> "Overall, we expected to notice a very strong and consistent
>> correlation between high utilisation and higher failure rates.
>> However our results appear to paint a more complex picture. First,
>> only very young and very old age groups appear to show the expected
>> behaviour." [1]
>
> Όταν έχεις 10 συστήματα στο χώρο εργασίας σου, τότε σε συμφέρει να
> έχεις 2
> spare δίσκους σφραγισμένους στο συρτάρι σου. Όταν έχεις 100 συστήματα
> διασκορπισμένα σε όλη την χώρα, σε συμφέρει να έχεις έναν hotspare σε
> κάθε
> σύστημα, γιατί η πιθανότητα να βρεις άτομο να κάνει την αντικατάσταση
> έγκαιρα
> και με τον δίσκο να είναι διαθέσιμος χωρίς να έχει καταλήξει στο pc του
> υπαλλήλου που κάνει καθημερινά τοπικό backup το youporn, είναι αρκετά
> μικρότερη
> από την διπλή αστοχία υλικού στο ίδιο σύστημα.
Και πάλι εξαρτάται - σενάριο:
Έχεις στο "χώρο εργασίας σου" ένα server με RAID5 array αποτελούμενο από
έξι spindles του ενός TB το καθένα. Όταν (και όχι "αν") χάσεις ένα
spindle, μετά την αντικατάστασή του θα χρειαστούν πολλές (ίσως και πάρα
πολλές ανάλογα το hardware) ώρες για το rebuild. Μέχρι τη στιγμή που θα
τελειώσει το rebuild είσαι εκτεθειμένος στην πιθανότητα απώλειας
δεδομένων στην περίπτωση που χαθεί και δεύτερο spindle.
Ας υποθέσουμε τώρα ότι είναι Παρασκευή 29 Δεκεμβρίου, 17:45. Όλος ο
κόσμος έχουνε πάει στα σπίτια τους και ετοιμάζονται για το
πρωτοχρονιάτικο τετραήμερο. Και ένας καταραμένος από τους 6 SATA WD
αποφασίζει να τα κακαρώσει... έχεις τουλάχιστον 112 ώρες ρίσκου μέχρι
την ώρα που θα πάει κάποιος στο γραφείο να αλλάξει το δίσκο. Και άλλες
50 ώρες πιθανότατα μέχρι να τελειώσει το resync. Δευτέρα κοντά μεσάνυχτα
εγκαταλείπει τα εγκόσμια και δεύτερος δίσκος. Αποχαιρέτα τα 100+ Inboxes
που χάνεις... Ένα hot spare θα κόστιζε άλλα €200. Τα δεδομένα που
χάθηκαν τι κόστος επιφέρουν;
Ένας ακόμα συντελεστής θα μπορούσε να είναι η περίπτωση που η εν λόγω
επιχείριση δεν έχει full-time sysadmin και πρέπει να ειδοποιηθεί κάποιος
να έρθει να αντικαταστήσει τον δίσκο, εισάγοντας ακόμα μεγαλύτερες
καθυστερήσεις.
Συμπέρασμα - που θα έπρεπε να είναι προφανές αλλά δυστυχώς δεν είναι:
Όταν τα δεδομένα σας αξίζουν πολύ περισσότερο από τους 1-2 έξτρα δίσκους
και ίσως επιπλέον HBAs, "κάλλιο γαϊδουρόδενε".
Φιλικά,
Απόλλων
More information about the Linux-greek-users
mailing list