daemon monitoring [flame]

Alexandros Kosiaris alex at noc.ntua.gr
Fri Nov 16 21:28:26 EET 2007


V13 wrote:
> On Friday 16 November 2007, Alexandros Kosiaris wrote:
>> V13 wrote:
>>>   Anyway, ara apeythynetai se osoys kseroyn ek ton proteron oti mia
>>> ypiresia tha exei tetoia symperifora kai oxi san ena geniko diaxeiristiko
>>> ergaleio. Ara, h erotisi: "Eisai sigoyros oti einai kalh idea (tm) ?" den
>>> itan kai toso "ektos thematos", opos edeikse toylaxiston h ekbash toy
>>> thread.
>> Sorry αλλά έχεις λάθος. Το να σηκώνεις μία υπηρεσία και να πιστεύεις ότι
>> δεν θα υπάρξει πρόβλημα ποτέ μαζί της είναι εάν όχι ηλίθιο τουλάχιστον
>> αφελές.
> 
>   To na sikono mia ypiresia kai na pistevo oti den tha pesei *moni ths*, den 
> to theoro afeles. An yparksei opoiodipote problima logo configuration, 
> gematoy diskoy, kolima oste na min apokrinetai k.o.k., ap'oti blepo, to monit 
> den tha mporesei na kanei kati ousiodes (se antithesi me to nagios poy tha to 
> entopisei).

Κακώς. Οι υπηρεσία πέφτουν μερικές φορές και μόνες τους. Υπάρχουν και 
προγραμματιστικά λάθη που μπορεί να γίνονται triggered σε πολύ δύσκολο να 
εξομοιωθούν συνθήκες. Λαμβάνουν χώρα τόσο σπάνια που ο μόνος λόγος που υπάρχουν 
είναι να συμβούν ακριβώς την ώρα που κοιμάσαι ή χειρότερα είσαι διακοπές.

Επίσης δεν καταλαβαίνω γιατί συγκρίνεις τόσο πολύ nagios με monit. Εχουν τελείως 
διαφορετικό τρόπο deployment. Το monit εγκαθίσταται τοπικά σε κάθε μηχάνημα που 
θες να κάνεις monitoring και όχι μόνο αλλά να έχεις και self-healing. O κύριος 
ρόλος είναι το self-healing, όχι το monitoring.

Αντίθετα το nagios εγκαθίσταται σε ένα monitoring server που αναλαμβάνει μέσω μίας 
σειράς πρωτοκόλλων να ελέγχει N το πλήθος άλλους server ή switches ή routers και 
τις υπηρεσίες που αυτοί προσφέρουν και ενημερώνει για αλλαγές στην κατάστασή τους. 
Μπορεί άμα έχεις όρεξη να κάνει healing σε άλλα μηχανήματα αλλά για να το κάνεις 
αυτό θα πρέπει να κάνεις τρελό customization και να γράψεις αρκετό κώδικα.

Είναι διαφορετικά προγράμματα προορισμένα για άλλους ρόλους.

> 
>   Mexri stigmis, to mono sxetiko problima to opoio exo antimetopisei einai me 
> to bind se solaris, opoy stamatoyse na kanei resolve. Kai pali omos, to monit 
> den tha mporoyse na kanei kati giati den eixe problima me ola ta hostnames.
> 
>   Apo thn allh, theoro idiaitera shmantiko problima to na ksekinisei monos toy 
> enas demoas thn ora poy ton exeis katebasei esy (exo faei ores me sxetiko 
> peristatiko, epeidi to eixei ksekinisei kapoios allos kai den to eixa 
> katalabei), epeidi ksexases to monit.
Ναι είναι σημαντικό πρόβλημα αυτό που περιγράφεις, αλλά φταίς εσύ που ξέχασες το 
monit και όχι το monit.
> 
>   Kai gia na min milame ypothetika, exeis kapoio sygkekrimeno anti-paradeigma 
> apo thn empeiria soy? 
Ένα μόνο; Εχω δεί το bind σε debian απλά να πεθαίνει χωρίς λόγο και αιτία(το 
δύσκολο να εντοπιστεί προγραμματιστικό λάθος που λέγαμε, που λύθηκε με upgrade 
στην νεότερη έκδοση που είχε διορθωθεί) και που μέχρι να διορθωθεί έπρεπε να έχω 
uptime.
Εχω δεί high-availability clusters να πρέπει κάπως να κάνουν self-healing γιατί οι 
ρήτρες είναι στα 4 εννιάρια και αυτά είναι λεφτά που είναι κρίμα να χάνονται 
επειδή κοιμόμουν στις 3 το πρωί.
Εχω δεί Directory Servers που είναι backbone 10 υπηρεσιών απλά να σκάνε όταν 
λαμβάνουν συγκεκριμένα corrupted πακέτα που εμφανίζονται μία φορά το μήνα στο δίκτυο.

Οπως βλέπεις δεν υπάρχουν μόνο τα πολύ εμφανή προβλήματα που αναφέρεις και που 
όντως είναι ρόλος εσένα και του nagios να παρακολουθείς. Υπάρχουν και εκείνα τα 
καταραμένα που συμβαίνουν μία φορά το μήνα ή το δίμηνο και που δεν μπορείς να τα 
εντοπίσεις εύκολα και που δεν αξίζουν τον κόπο την αναβάθμιση στην τελευταία 
έκδοση του λογισμικού που μπορεί να τα λύνει αλλά μπορεί να σου βάζει άλλα 5.


-- 
Alexandros Kosiaris     Network Management Center , NTUA
e-mail : alex at noc.ntua.gr
Public Key Fingerprint :
D6B1 0634 BE65 719C 6C95  7492 8201 4B46 C478 F074

-------------- next part --------------
A non-text attachment was scrubbed...
Name: smime.p7s
Type: application/x-pkcs7-signature
Size: 5200 bytes
Desc: S/MIME Cryptographic Signature
URL: <http://lists.hellug.gr/pipermail/linux-greek-users/attachments/20071116/fa772f17/attachment.bin>


More information about the Linux-greek-users mailing list