stekut
7th February 2008, 13:21
Bonjour à tous.
Je migre actuellement (machine par machine) notre supervision.
Bizarrement je rencontre déjà des timeout Nagios ("ERROR: Alarm signal (Nagios time-out)") alors que j'ai à peine déployé 30 machines.
Y-a-t-il quelque chose à optimiser dans la conf' qui aurait échappé à ma vigilance ?
Plus étrange encore, quand un service passe en état de problème (Warn - Crit - Unknown) il ne re-check pas aussi fréquemment qu'il le devrait.
Typiquement, tous mes checks sont effectués toutes les 5min avec 2 retry toutes les 1 minutes, là il est 12h24 (heure machine), dernier contrôle à 12h12, durée 11m58, essais 1
Normalement nagios devrait avoir fait un autre contrôle depuis le temps et devrait avoir fait plus d'1 essai...
Pour info, je dispose d'un IBM xSeries 346 avec 2 CPU bi-processeurs Intel Xeon cadencés à 3,2GHz, 4Go de RAM, je ne pense donc pas avoir atteint les limites de la bête :-)
RedHat Entreprise Linux 4 Update 5
Nagios 2.9 - Centreon 1.4.1
Quelqu'un a des idées ?
D'avance merci.
Je migre actuellement (machine par machine) notre supervision.
Bizarrement je rencontre déjà des timeout Nagios ("ERROR: Alarm signal (Nagios time-out)") alors que j'ai à peine déployé 30 machines.
Y-a-t-il quelque chose à optimiser dans la conf' qui aurait échappé à ma vigilance ?
Plus étrange encore, quand un service passe en état de problème (Warn - Crit - Unknown) il ne re-check pas aussi fréquemment qu'il le devrait.
Typiquement, tous mes checks sont effectués toutes les 5min avec 2 retry toutes les 1 minutes, là il est 12h24 (heure machine), dernier contrôle à 12h12, durée 11m58, essais 1
Normalement nagios devrait avoir fait un autre contrôle depuis le temps et devrait avoir fait plus d'1 essai...
Pour info, je dispose d'un IBM xSeries 346 avec 2 CPU bi-processeurs Intel Xeon cadencés à 3,2GHz, 4Go de RAM, je ne pense donc pas avoir atteint les limites de la bête :-)
RedHat Entreprise Linux 4 Update 5
Nagios 2.9 - Centreon 1.4.1
Quelqu'un a des idées ?
D'avance merci.