View Full Version : État Undeterminated
fredo
09-17-2007, 06:34 PM
Bonjour,
Dans la partie Reporting de Centreon, pour tout les hôtes l'état Undeterminated est non nul alors que les serveurs surveillés fonctionnent sans problème. Je surveille l'état des serveurs avec check_host_alive.
Par exemple pour aujourd'hui à 17h26m, j'ai pour un serveur :
Etat Temps Temps Total Temps connus Alertes
Up 7h 29m 35s 42.95% 100% 0
Down 0% 0% 0
Unreachable 0% 0% 0
Undeterminated 9h 57m 12s 57.05%
Tout 17h 26m 47s 100% 100% 0
Si on additionne 7h29m et 9h57m on obtient l'heure actuelle, mais d'où sort cette valeur Undeterminated ? :)
Merci d'éclairer ma lanterne.
Guigui2607
09-18-2007, 09:03 AM
As tu redémarré le serveur Centeon / Nagios dans la journée ?
Si oui, l'option state_retention dans Nagios est elle activée ?
Ça pourrait peut-être être une piste...
fredo
09-18-2007, 11:13 AM
J'ai juste rechargé Nagios via Centreon (Recharger Nagios --> Reload), pour prendre en compte des modifications.
Sinon au niveau de la conf de Nagios, j'ai ceci :
State Retention Option: Oui
Automatic State Retention Update Interval : 60
Use Retained Program State Option : Oui
Use Retained Scheduling Info Option : Défaut
fredo
09-18-2007, 04:29 PM
Aujourd'hui je n'ai fait aucun changement de configuration et je n'ai donc pas rechargé Nagios, tout les hôtes sont en "Undeterminated" à 100% ?!! :shock:
J'ai regardé pour quelques hôtes sur des périodes plus longue est ils sont tous en "Undeterminated" à 100% .
J'ai rechargé (reload) Nagios avec Centreon est j'ai un état "UP" de 2m46s.
retain_state_information est validé et le fichier state_retention_file existe :
$ ls -al /usr/share/nagios2/var/status.sav
-rw------- 1 nagios nagios 103633 2007-09-18 15:26 /usr/share/nagios2/var/status.sav
fredo
09-19-2007, 03:58 PM
Bonjour,
Ce matin, j'ai regardé le Reporting et tout les hôtes sont, pour la période d'aujourd'hui, dans un état "Undeterminated" à 100% et pour la période d'hier idem "Undeterminated" à 100 %..
Pourtant hier après avoir relancé (reload) Nagios via Centreon, j'avais un reporting à UP pour tout les hôtes sur un temps qui correspondait à l'heure depuis le reload.
J'ai l'impression que Centreon perds les données de Reporting d'un jour sur l'autre. Il s'agit d'une installation toute fraîche de Centreon 1.4.1, le monitoring et les vues (graphs) fonctionnent sans problème, j'ai des grqphs sur plusieurs semaines.
Si quelqu'un pouvait me donner un piste de recherche ?
Merci.
fredo
09-21-2007, 01:54 PM
Bonjour,
En faisant des recherches sur ce qui tournent vers minuit pour traiter les données, j'ai regardé la crontab de Nagios et les scripts contenu dans le répertoire "/usr/local/oreon/cron".
Je me suis aperçu que le répertoire "archives" dans "/usr/share/nagios2/var" n'existait pas, après l'avoir créé tout est rentré dans l'ordre.
D'après la FAQ http://wiki.oreon-project.org/index.php/FAQ#Reporting les fichiers PHP "inventory_update.php" et "ArchiveLogInDB.php" fonctionnent mal avec PHP5. Lors de mes tests, j'ai pu les faire fonctionner sans problèmes avec PHP4 (ver. 4.4.4-9) et PHP5 (ver. 5.2.3-1). Ils fonctionnent maintenant avec PHP5, la FAQ peut être mise à jour. :D
Pour purger les donnes remontees a ce niveau, lancer le script a la main avec l'option -d :
#php ArchiveLogInDB.php -d
Sinon oui, le mecanisme est de recuperer a 00h00 le fichier de log de la journee et de la parser. Ce fihcier est drope par Nagios a 23h59.
Si votre fihcier est gros, ou le serveur un peu a la traine, lancez le cron a 00h05.