View Full Version : Graph vide (ou avec très peu de mesure)
Davis
03-20-2008, 08:48 PM
Dans "Vues Oreon", en prenant exemple d'un host toujours actif (puisque c'est un CISCO); avec la commande de check "check_centreon_ping" et "!3" en argument, j'ai que deux plages de mesure depuis hier...
Pour tester au maximum, j'ai créé autant de service qu'il y a de "Graph Modèle"
En résultat, j'ai donc (choix "dernières 24h"):
Service actif dès hier :
(avec Latency "standard") : un point "vert" à 8h30... un autre à 12h30
(avec Default graph) : un rond plus épais que à 12h30
(avec Latency "modifié en paramétrage pour avoir 5 reprises toutes les 5mn...") : un petit graphique entre 1 et 1,4 de hauteur de 12h30 à 14h
(avec Load avarage) : un escalier entre 0,98 et 1,2 de haut de 12h30 à 12h35
(avec OSL) : un trait oblique de 0 à 1 de haut...
(avec Traffic) : deux points (rouge et vert) à 1 et 1,05 de haut à 12h30
(les autres) : graph vide...
Le pire est que 12h30, c'est juste l'heure à laquelle je suis parti manger, laissant mon centreon à rien faire...
Voila...
Pour info, je crois bien que à 14h, je n'avais pas vu les petits mouvements entre 12h30 et 12h35...
Enfin, sur les autres hosts, c'est pire (tous les graph sont vide)
Merci à vous
-Signature----------------------------------------------------------------
Info : Ubuntu 7.10 « Gusty Gibbon »(Firefox) - Apache2 - Mysql 5.0 - PHP 5 - Nagios V2.10 - Centreon-1.4.1(81 Hosts - 85 Service)
J'avais aussi uniquement quelques points sur mes graphiques à un moment, J'ai mis les check toutes les 2 minutes pour le load, toutes les 3 minutes pr la mémoire, toute les 5mn pour le traffic etc... en essayant de ne pa dépassez les 5mn pour faire des graphes bien continus.
Sinon c'est que tu envoie trop de requetes en meme temps et pas assez souvent pour que centreon puisse créer des graphiques avec les valeurs récupérées. Donc gère mieux l'envoi de requete et ça devrait refonctionner.
Davis
03-21-2008, 07:14 PM
LG, tu m'as mis sur une piste... Mais c'est pas encore ça !
Je m'explique :
Puisque tu me parles de surcharge... Je teste en diminuant le nombre de service de test... (je les desactive, et vide les RRD)
Et puisque tu me dis utiliser des paramètres à 2, 3 et jusqu'à
5mn... Je reconfigure tous mes services
J'avais mes check_host_alive toutes les minutes -> Passage à 5mn (je suis pas à 4mn près)
J'avais mes check_centreon_ping toutes les minutes -> Passage à 2mn (pour tester et être sur le voir des graph utilisable)
J'avais aussi passé mon argument de "!3" à "!1" pour être sur de ne pas surcharger pour rien...
Je regénéres mes RRD
Et là, je patiente et je re-graph... Oh surprise, je vois des infos de graph là ou je ne les voyait pas !!! Par exemple, ce jour, de 8h à 12h30 sans discontinuer... des petits bout de 12h45 à 12h46... de 12h59 à 13h01... de 14h10 à 14h20... de 14h25 à 14h45... de 15h à 15h30... des minutes vers 16h...
Ce qui est bizarre, c'est qu'à17h, je n'avais pas vu ces infos !!! C''etait vide !!!
Tout aussi bizarre de voir que j'ai pas plus d'info depuis ces mofications (j'ai modifié vers 18h... Au bout de 20mn, c'est encore vide...
Ca sent le bug, non ?
Davis
03-21-2008, 08:14 PM
Je rectifie... GRAND MERCI LG............
Bon, je crois comprendre...
Je viens de passer à "4mn"... Et là, j'ai des graph depuis 3 jours quasi inintérrompu !!!
Est-ce à dire que RRD utilise cette valeur pour "relier les points séparé jusqu'à 4mn" ???
Pour vérifier, j'ai remis 3 mn... et j'ai quasiment plus rien... j'ai remis 4mn... et j'ai tout !!!
Victoire...
Bon, je cloture cet épisode...
Davis
03-21-2008, 10:18 PM
Et, ben finalement, c'est encore la m...
A savoir, j'ai un beau graphique depuis 3 jours... Mais plus rien depuis que j'ai passé mes timing à 4mn !!!
La, je vois pas !!!:cry:
DonKiShoot
03-21-2008, 10:24 PM
La règle quand tu ne maitrises rien, c'est de mettre 5mn et de t'assurer que nagios ordonnance bien ces checks toutes les 5mn.
Aviscdr
03-22-2008, 04:05 AM
J'ai pour l'instant corrigé le problème et adapté ma configuration à la charge (donc au nombre de machines et services). J'en profite pour faire un petit post résumé des actions que j'ai effectué (pompées sur le forum, mais un peu partout).
=> Modification de la commande check_host_alive par:
Quote:
$USER1$/check_icmp $HOSTADDRESS$ -w 40000,80% -c 50000,100% -n 20
=> Modification des options de Nagios:
- Agressive Host Checking Options: Non.
- Maximum Concurents Services Check: 60 (à voir en fonction de la charge).
=> Réactivité des hôtes:
- Nombre maximum d'essais: 2
- Ordonnancement régulier: RIEN DU TOUT
=> Réactivité des services:
- Nombre maximum d'essais: 5
- Ordonnancement régulier: 1
- Ordonnancement non régulier: 1
Opération avec laquelle j'ai retrouvé mes graphiques.
Davis
03-22-2008, 11:46 PM
Malheureusement, j'ai pas accès à mon serveur avant mardi, j'ai qu'un mini réseau (1 hub et 3 ou 4 pc à connecter), j'ai tout de même simuler hier mon nombre de host et de service (au bout de 10 duplications de hosts à la même adresse et 8 services identique mais aux type de graph différent, j'ai poussé le vis à mettre 100 tests à la minutes sur un des service... Et là, c'est clair, ca bloque tous les autres graph)...
J'ai aussi vu une solution alternative : http://forum.centreon.com/showthread.php?p=27851
Je vais tester tout ça...
Sinon, j'ai un Centreon 1.4.1, est ce que ca veux dire que j'ai un 1.4 RC1 ? Devrais je pas essayer de passer les RC2, 3, 4 et 5 ?
En tout cas, merci pour vos precieuses réponses...
Aviscdr
03-23-2008, 12:41 AM
Aucun problème, tiens nous au courant !
Davis
03-25-2008, 09:44 PM
Comme promis, voila des nouvelles, et bonnes en plus ;)
J'ai bien du faire un mixt d'un peu tout là...
J'ai pas modifier la commande "check_host_alive", mais j'ai bien modifier la config nagios
- Agressive Host Checking Options: Non.
- Maximum Concurents Services Check: 60 (j'ai mis ca aussi, et ca marche).
Pour les host, j'ai mis 15mn pour les imprimantes et 5mn pour le reste, avec bien :
- Nombre maximum d'essais: 2
J'ai aussi modifié les services
Et pour le problème de config RRD (à vérifier si le "metric" est égale au "step" en faisant un rrdtool info toto.rrd...), en ce cas, il y a deux fichiers à metre (ods et un "updateFunction..", et apres paramétrage du fichier ods et un restart de ods, ca devient parfait !
Merci à tous
yoyoyoyoyo
04-10-2008, 09:48 PM
Bonjour. Appaerement tu as trouvé des solutions mais je n"ai tres bien pigé comment tu as resolu ton bug. Peut tu donner plus d"explications.
Merci
Davis
04-10-2008, 11:24 PM
Mes solutions pour m'en sortir ont été sur 4 plans :
1) Au niveau du "check_host_alive"...
J'ai modifier la config nagios
- Agressive Host Checking Options: Non
- Maximum Concurents Services Check: 60
2) Au niveau des hosts
J'ai mis 15mn pour les imprimantes et 5mn pour le reste
J'ai modifié
- Nombre maximum d'essais: 2
3) Au niveau des services
J'ai modifié comme ce qui m'a été conseillé
4) Pour les RRD
Le problème de RRD est la valeur des metric
On test comme suit :
rrdtool info toto.rrd
et si la valeur de "metric" est égale au "step", il faut :
a) Récupérer les fichiers suivant : ods et updateFunctions.pm de debug RRD (ils sont dans le post 39 de : http://forum.centreon.com/showthread.php?t=4475&page=4 )
b) Modifier le fichier ods pour y mettre les bons chemin
c) Installer ces fichiers (en sauvegardant les anciens au cas où)
d) Faire un restart
Voilà