View Full Version : Pourquoi le tracé des graphiques cesse ???
pastaga
08-16-2007, 05:38 PM
Bonjour,
Centreon graphait correctement depuis 48H. Il a fallu que je rajoute ou modifie quelques hôtes et services pour que celà ne fonctionne plus. J'ai un arrêt du tracé à 11H10 environ. Je n'ai pas touché à la config, mais uniquement aux hôtes et services.
Comment puis-je faire redémarrer le tracé ?
J'ai déjà redémarré les services ODS, mysql, Nagios. Rien !
J'ai effacé mes fichiers RRD, régénérer la base RRD. Rien !
Une suggestion Doc ?
Merci
Salut:
J'ai exactement le même problème. J'ai un arrêt des graphs sans aucunes raisons particulière.
ludo_x
08-17-2007, 01:06 PM
Pour ma part, j'ai fait cela :
nano /root/correct_rrd.sh
#!/bin/sh
cd /usr/local/oreon/OreonDataStorage
for f in *.rrd; do rrdtool tune $f --heartbeat metric:600; done
exit 0
chmod +x /root/correct_rrd.sh
Pour l’exécuter : ./root/correct_rrd.sh
Exécutez le script et la magie se fait ^^
pastaga
08-17-2007, 02:46 PM
Ben le script marche po ERROR: unknown data source name 'metric'.
J'ai parcouru le forum concernant RRDTOOL et les parmaètres heartbeat et step. Il s'avère que mes fichiers .RRD ont tous la même valeurs pour ces 2 paramètres.
Comment expliquer alors la fin subite des graphs ? Est-cd du au rajout d'un service qui ne peut pas avoir les mêmes pas de temps ou les mêmes échelles que les autres ? Pourquoi faut-il bidouiller les rrd manuellement ?
Je vais tester les bidouilles...
pastaga
08-17-2007, 03:26 PM
OK ! Effectivement, j'ai tuné les RRD (dsl, ça fait un post de plus sur le sujet, mais je ne croyais pas être concerné par les autres posts).
J'ai modifié tous les paramètres heartbeat de ma petite dizaine de fichiers rrd (courage à toi fufu et ton tas d'hôtes et services, même si toujours les mêmes commandes qu'on appliquent). Il faut juste un peu modifier le script en jouant sur les paramètres (pour moi) time, size, ok, traffic_in, traffic_out, metric...
Bon espérant que ça graphe longtemps, loongteeemps, looooongteeeeeemps...
Je viens de faire la manip, j'attends un peu. J'ai un step de 90 pour un heartbeat de 600. J'espere que ca sera bon ... Et merci pastaga pour l'encouragement ^^
pastaga
08-17-2007, 04:34 PM
Ouai ben ça aura pas durer looooongteeeemps !
Du coup j'ai réactivé mes hôtes et services que j'avais désactivés. Est-ce lié.
Enervé, j'ai effacé tous les rrd en cours et archivé (un bon vieux rm -rf * qu'on y réfléchit à 2 fois avant d'appuyer sur Entrée...).
Mes fichiers RRD générés ont tous récupérés un step à 70 et un heartbeat à 70.
Certes, j'ai plus de graphiques du tout...
Bon je bais un script qui modifie le heartbeat, et laisser tourner tout le week-end...
Bah meme en modifiant le heartbeat j'ai aucun graph. Faut t'il que le heartbeat soit pile poil égal au double du step ?
pastaga
08-17-2007, 05:27 PM
Ben quand j'ai eu à nouveau mes graph pendant qq minutes, j'avais mis hearbeat=2xstep (soit 70 et 140). Mais, ça a pas duré longtemps ! Bizarre les valeurs de 600, moi il me mets toujours 70 !
Donc là, je sais pu moi ! Je verrai lundi... Je viens de mancer le script de correction des rrd, et j'ai rien !!!!!
Ben je va essayer avec 600 alors !
A+
pastaga
08-17-2007, 05:42 PM
Ooooooooooohhh ! Ca commence à grapher, je vais laisser tourner tout le week-end...
Récap : check des hosts et services toutes les minutes (ouai ça fait beaucoup, mais c'est pour tester...), ordonnancement non régulier toutes les 5 minutes, step 70, heartbeat modifié à 600...
Fufu : t'as combien de fichiers RRD ?
Bon week-end
Salut:
Bon j'ai toujours aucun tracé. Je suis en step 70 et en heartbeat 600. J'ai actuellement 31 fichier rrd dans /usr/local/oreon/OreonDataStorage.
pastaga
08-20-2007, 10:59 AM
Bonjour,
Vla une semain qui commence mal !!!
Mon PC était en croix ce matin, obligé de rebooter à la sauvage comme un Windows !!!
J'ai un gros soucis, je n'arrive plus à relancer le daemon mysql !!!:confused:
Mes fichiers RRD datent du 19 à 07H56, plus rien après...
J'ai des merdes avec les log de mysql :
070820 10:15:02 mysqld started
070820 10:15:03 InnoDB: Database was not shut down normally!
InnoDB: Starting crash recovery.
InnoDB: Reading tablespace information from the .ibd files...
InnoDB: Restoring possible half-written data pages from the doublewrite
InnoDB: buffer...
070820 10:15:03 InnoDB: Starting log scan based on checkpoint at
InnoDB: log sequence number 0 15611737.
InnoDB: Error: tried to read 65536 bytes at offset 0 5123584.
InnoDB: Was only able to read -1.
070820 10:15:03 InnoDB: Operating system error number 5 in a file operation.
InnoDB: Error number 5 means 'Input/output error'.
InnoDB: Some operating system error numbers are described at
InnoDB: http://dev.mysql.com/doc/mysql/en/Operating_System_error_codes.html
InnoDB: File operation call: 'read'.
InnoDB: Cannot continue operation.
070820 10:15:03 mysqld ended
De plus, j'ai le daemon ODS qui tourne en utilisant près de 80 à 90% du proc. Est-ce du à l'absence du service mysql ?
Quelqu'un a une idée pour mysql. Faut-il augmenter des valeurs de buffer ou modifier des parmètres dans le fichier /etc/my.cnf ?
pastaga
08-20-2007, 06:13 PM
Ben, en fait c'était les prémices de la mort annoncée de mon PC...
Nouveau PC, nouvelle install.
Bon pour moi niquel , le tracé des graph refonctionne. Je sais pas pourquoi mais absolument tous les graph marche .
merci à tous et ++
boyerf
08-21-2007, 12:56 PM
Bon pour moi niquel , le tracé des graph refonctionne. Je sais pas pourquoi mais absolument tous les graph marche .
merci à tous et ++
Tu as modifié ton heartbeat à la main pour le placer à 600 ?
Et si tu regeneres les RRD a travers l'interface d'Oreon, il ne te place pas le heatbeat = step ??? (si tu testes fait une svg avant !!!)
Salut:
Si je fait une regénération le step = heartbeat. Sinon oui j'ai mis le heartbeat à 600 à la main mais je pense pas que ca vienne de cette modif parce que ca c'est mis a fonctionner presque 5 jours apres la modif.
pastaga
08-22-2007, 10:55 AM
Bon, j'ai du réinstaller Centreon sur une nouvelle bécane.
J'ai modifié les ordonnancements réguliers et check host à 5' (au lieu de 1' auparavant), les ordonnancements irréguliers à 10'.
Les graphiques fonctionnent, les steps et heartbeat sont à 310. Donc il semblerait que les valeurs de heartbeat=valeur ordonnacement régulier en seconde+10 (quand j'avais paramétré l'odonnacement à 1', j'avais pour valeur de step et hearbeat 70). Me trompje ?
Je vais laisser ces valeurs par défaut pour voir...
A+
Il faudra demander confirmation a Julio, mais d'apres ce que j'ai compris, le heartbeat est egal au normal_check_interval (en secondes) + 30 secondes.
Face au nombre important de posts qui traduit des problemes, je pense que ce seuil va etre augmenté, et pourquoi pas tout simplement heartbeat = 2 x normal_check_interval, comme tout le monde le reclame.
Alors vu que vous etes en 1.4.1, c'est normal que quand vous tunez a la main vos bases, elles prennent la valeur que vous indiquez. Maintenant si vous passez apres via l'interface, la methode de calcul du heartbeat n'a pas changée, il faut donc attendre la 1.4.2 ou un patch pour resoudre votre probleme. Mais c'est une bonne nouvelle, on avance :-) On peut donc dire que dans la 1.4.2, les graphs seront parfaits ;-)
boyerf
08-22-2007, 03:56 PM
Pas de soucis... si on s'entraide tous on va s'en sortir... Puis on va commencer à le connaitre Centreon ;-)
icedance
08-23-2007, 05:53 PM
Meme punition ... meme motif
et j'ai remarqué que le fichier de log ne bougeait plus du tout (/usr/local/oreon/ODS/var/ods.log) sauf pour le start de ODS
Suis je le seul ? est ce lié ? ca fait avancé le truc ?
edit : j'ai aussi ce message la ....
Use of uninitialized value in string ne at /usr/local/oreon/ODS/lib/identitifyMetric.pm line 87, <PFDT> line 28
Ca parle a quelqu'un ?
seb974
08-28-2007, 08:09 AM
Tout mes graphs se sont arrêtés au bout de 4 jours environ :/
julien60
08-28-2007, 10:38 AM
moi ça fait un bon moment que je n'ai plus de graphs non plus ... j'ai tenté de tuner mes rrd à la main j'ai revérifié à maintes reprises la configuration... mais toujours rien....
Cajiss
09-11-2007, 04:35 PM
Le serveur que j'ai mis en place doit superviser un réseau composé comme suit :
- 31 serveurs avec 3 services chacun.
- 30 switchs avec 1 service par port. (50 ports/switch)
cette supervision nécessite donc environ 1 600 services.
Après avoir testé le fonctionnement de chaque service sur un hote standart(switch & serveur), l'ensemble des services tournaient correctement sans erreur et graphaient parfaitement. (sauf que bizarrement, les graphs ne se faisait que le jour de 8H00 à 18H00 alors qu'il etaient configuré pour 7X24).
J'ai configuré la totalité des hotes et des services, j'ai chargé la configuration, et là, d'une part, il était évident que la machine sur laquelle tournait nagios était trop peu puissante, mais en plus il a stoppé tous les graphs et ne les a jamais repris, meme apres avoir fini de bien chargé les hotes et services. (config serveur test : débian etch avec 1MO de swap + P4 1.6 avec 512 MO RAM)
Il me semblait donc evident que d'une part la machine était pas adapté, mais que c'etait aussi la cause de l'arret total des graphs. j'ai donc supprimer la majorité des services et j'ai réinitialisé le tout, et mes graphiques ont repris comme avant.
Je me demandais donc en lisant tous les soucis de graphs, si les nombre de services et la puissance des machines sur lesquels vous faites tourner nagios n'ont pas un rapport également avec l'absence de graphs ?
ceci n'expliquant pas malgré tout pourquoi mes graphs se stoppent d'environ 18H00 à 8H00 environ ?
j'ai appliqué le script suivant #!/bin/sh
cd /var/lib/ods/database
for f in *.rrd; do rrdtool tune $f --heartbeat metric:600; done
exit 0
pour tester de remédier a ca mais il me repond : ERROR: unknow data source name 'metric'
ci ces quelques infos peuvent aider ?
ludo_x
09-17-2007, 10:38 AM
Bonjour à tous,
Finalement j'ai encore des soucis de graphes, très hachés ou plus du tout :(
Si je mets la metric à 900 au lieu de 600, cela remarchera ?
lowdata
09-17-2007, 11:31 AM
wé bin pareil, des graphes qui marchent et qui marchent pu, comme a peu pres un user sur 2 d'oreon a priori oO. Les dev d'oreon semeblent avoir deserté le forum, ou alors c'est pas bien grave si ca ne graphe pas on dirait.
Donc si quelqu'un aurait une SOLUTION DEIFNITIVE a l'arrete des graphes, ce serait une bonne idée de la détailler plutot que de faire galerer de multiples users sur ce sujet la. (Il faut voir le nombre de posts créesa cet effet dernierement....)
Salut,
Je n'ai jamais eu problème sur les graphs... Ca ne pourrai pas etre du un problème de place coté BDD ou system (la ou tu mets les RRD) ???
Tu suppervises ta machine Nagios ? Regarde les graphs coté loadaverage, cpu, mem... (enfin les derniers graphs que tu as). On ne sais jamais, ca pourra te dire si ton système est en cause, pas assez de RAM/CPU...
Tu as regardé coté log ODS ?
lowdata
09-17-2007, 12:27 PM
un apercu de mon ods.log :
1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188788292 -> 4.45155e+09 : illegal attempt to update using time 1188788292 when last update time is 1188788292 (minimum one second step)
1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188804986 -> 4.44871e+09 : illegal attempt to update using time 1188804986 when last update time is 1188804986 (minimum one second step)
1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188807617 -> 4.45704e+09 : illegal attempt to update using time 1188807617 when last update time is 1188807617 (minimum one second step)
1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188807986 -> 4.45704e+09 : illegal attempt to update using time 1188807986 when last update time is 1188807986 (minimum one second step)
1189511858 - 35585 value insert
1189683177 - Receiving order to stop...
1189683181 - Stopping ODS engine...
1189683344 - Starting ODS engine...
1189683344 - PID : 2184
1189762576 - Receiving order to stop...
1189762579 - Stopping ODS engine...
1189762580 - Starting ODS engine...
1189762580 - PID : 24627
1189762580 - Creating /usr/local/oreon/OreonDataStorage/275.rrd -b 1189557365, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189762580 - Creating /usr/local/oreon/OreonDataStorage/276.rrd -b 1189557365, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189768589 - Creating /usr/local/oreon/OreonDataStorage/277.rrd -b 1189568374, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189768589 - Creating /usr/local/oreon/OreonDataStorage/278.rrd -b 1189568374, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
sinon pas de souvcis niveau machine, elle a tout ce qu il faut pour bosser et est 100% stable.
icedance
09-17-2007, 12:32 PM
Non mais non
ca viens pas des ressources c'est forcement autre chose
moi j'ai doublé la Ram de ce que j'utilise ... pas de changement ...
et le processeur est loin d'être sur les genoux
et les log ODS a par nous dire que tout fonctionne et qu'il rentre les informations corectement en créant une nouvelle RDD ...
Combien tu supervises de host pour pas avoir de soucis?
Combien graph ?
Et pour essayé de se sortir de ce truc si on pouvait répondre a ca :
http://forum.oreon-project.org/showthread.php?t=4650
merci
edit :
allé je montre :
Graph qui fonctionne presque bien :
http://img101.imageshack.us/img101/2376/screenhunter06sep171239ly8.gif
Graph qui fonctionen pas du tout :
http://img262.imageshack.us/img262/152/screenhunter07sep171239oj0.gif
Load machine en pique ( sachant que j'ai déjà doubler la ram et que ca n'a rien fait donc :
http://img390.imageshack.us/img390/4254/screenhunter08sep171240bs7.gif
Le code d'un fichier rrd.
filename = "/usr/local/oreon/ODS/8773.rrd"
rrd_version = "0003"
step = 130
last_update = 1190025797
ds[traffic_out].type = "GAUGE"
ds[traffic_out].minimal_heartbeat = 130
ds[traffic_out].min = NaN
ds[traffic_out].max = NaN
ds[traffic_out].last_ds = "UNKN"
ds[traffic_out].value = NaN
ds[traffic_out].unknown_sec = 77
...
et mon log de ODS
1189675805 - Starting ODS engine...
1189675805 - PID : 5872
1189675805 - Creating /usr/local/oreon/ODS/8642.rrd -b 1189474563, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189675806 - Creating /usr/local/oreon/ODS/8643.rrd -b 1189474563, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189675806 - Creating /usr/local/oreon/ODS/8644.rrd -b 1189474564, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
1189675806 - Creating /usr/local/oreon/ODS/8645.rrd -b 1189474564, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286
wé bin pareil, des graphes qui marchent et qui marchent pu, comme a peu pres un user sur 2 d'oreon a priori oO.
Les dev d'oreon semeblent avoir deserté le forum, ou alors c'est pas bien grave si ca ne graphe pas on dirait.
Euh non, on connait le probleme, des reponses ont ete donnees, mais comme tu dis "un user sur 2" post au lieu de chercher, donc ca devient illisible.
Donc si quelqu'un aurait une SOLUTION DEIFNITIVE a l'arrete des graphes, ce serait une bonne idée de la détailler plutot que de faire galerer de multiples users sur ce sujet la.
J'invite donc demain, ceux qui ont des problemes a me transmettre par MP des identifiants de connexion sur leur plateforme, ce qui me permettra de valider que la correction fonctionne partout, et on vous sort un truc dans le wiki dans la foulee.
icedance
09-18-2007, 10:24 AM
J'invite donc demain, ceux qui ont des problemes a me transmettre par MP des identifiants de connexion sur leur plateforme, ce qui me permettra de valider que la correction fonctionne partout, et on vous sort un truc dans le wiki dans la foulee.
Tu parles des betas testeurs la non ?
lowdata
09-18-2007, 10:51 AM
Euh non, on connait le probleme, des reponses ont ete donnees, mais comme tu dis "un user sur 2" post au lieu de chercher, donc ca devient illisible..
Ah ok on est bete nous serieux :=) Sinon tu pourrais m'indiquer UN post donnant une solution definitive a ces soucis, suivi du post du user entirement satisfait ? comme ca je vous ennuirai pas hin.
J'invite donc demain, ceux qui ont des problemes a me transmettre par MP des identifiants de connexion sur leur plateforme, ce qui me permettra de valider que la correction fonctionne partout, et on vous sort un truc dans le wiki dans la foulee.
Ouit tu parles pour qui ? Sachant que je suis dans une boite avec firewall, je doute qu'ils me laissent ouvrir les ports pour bosser sur oreon de l'exterieur :=). Mais une doc serait une brillante idée. Merci d'avance.
DonKiShoot
09-18-2007, 04:24 PM
Sachant que je suis dans une boite avec firewall, je doute qu'ils me laissent ouvrir les ports pour bosser sur oreon de l'exterieur :=).
Si ils ont assez de tune pour se payer un firewall et l'admin qui va avec, t'as plus qu'a demandé à la boite une prestation de Merethis :D
Ah ok on est bete nous serieux :=)
Mais non je ne dit pas ca, je dis juste que vu la multiplication des posts, c'est carrement impossible pour nous d'aller voir/traquer le bug dans les threads, ainsi que les reponses associes. Il y a un outil qui s'appellele bug tracker qui est l'endroit pour ces trucs la.
Vu le travail que l'equipe du projet a sur les epaules, c'est completement impossible d'aller gratouiller dans tous les threads... On voit qu'il y a des problemes, des pistes nous ont ete donnee et globalement le probleme va etre resolu, mais si vous nous aviez envoye un joli rapport sur nos boites, avec qq tests a la cle, la on aurait pu etre ultra rapide...
Je ne veux pas enfoncer le clou mais dans les mises en oeuvre que l'on fait, on a pas trop ce genre de problemes, donc c'est difficile de bien valider nos corrections, car meme si va vous parait dingue, nous n'avons pas de trous dans nos graphs, sur nos n plateformes qui tournent :P
Sinon tu pourrais m'indiquer UN post donnant une solution definitive a ces soucis, suivi du post du user entirement satisfait ? comme ca je vous ennuirai pas hin.
Je vous met un patch pour demain en dl.
Ouit tu parles pour qui ? Sachant que je suis dans une boite avec firewall, je doute qu'ils me laissent ouvrir les ports pour bosser sur oreon de l'exterieur :=).
D'une maniere dissimulee, je proposais l'aide gracieuse de Merethis pour resoudre ton probleme. Un tunnel VPN ou un simple transfert de port sont des choses assez banales pour un admin quand il s'agit de resoudre des problemes.
Mais une doc serait une brillante idée. Merci d'avance.
Mais je t'en prie http://wiki.oreon-project.org/index.php?title=Special:Userlogin&type=signup&returnto=Main_Page
icedance
09-18-2007, 10:32 PM
Je ne veux pas enfoncer le clou mais dans les mises en oeuvre que l'on fait, on a pas trop ce genre de problemes, donc c'est difficile de bien valider nos corrections, car meme si va vous parait dingue, nous n'avons pas de trous dans nos graphs, sur nos n plateformes qui tournent :P
Moi non plus mais je voudrais bien savoir combien de host tu as pour faire tes tests ? et si ca colle avec une infrastructure un peu chargée en user et des liaison pas forcement a fond ?
Et aussi bizare que ca peut paraitre moi aussi j'ai pas de trou dans certain de mes graphs avec un step = au heartbeat mais d'autre ca peche. Pourtant la config est la même pour l'ensemble des équipement.
Ca prouve bien que c'est certainement dut a l'environement réseau ou l'on se trouve et non pas forcement a la configuration que l'on a fait et/ou code de centreon que vous avez fait.
Tu vois ce que je veux dire ?
L'option qui laisse le choix de choisir le heartbeat pour chaque services pourrait etre une bonne chose a envisagé dnas le sens ou on est pas forcement maitre de l'environement que l'on veux supervisé et donc du temps de réponse des checks.
Moi non plus mais je voudrais bien savoir combien de host tu as pour faire tes tests ? et si ca colle avec une infrastructure un peu chargée en user et des liaison pas forcement a fond ?
Il y a un peu de tout en fait, difficile d'en parler ici et comme ca. Mais il faut dire aussi que ce n'est pas un Nagios qu'on charge et hop basta... On observe comment ca tourne, les points a optimiser, puis une fois que c'est viable on fait table rase et on demarre sur des bases propres.
Le fait est que demain je vous passe un patch, vous testez sur quelques elements incrimines et on trouve le meilleur moyen pour propager le correctif avant la 1.4.2
icedance
09-19-2007, 12:25 AM
super merci
pret a tester tout ce qu'il faudra :)
julio
09-19-2007, 02:27 PM
bonjour tout le monde...
donc je viens de patcher un peu la version 1.4.1. voila le patch pour ODS pour automatiquement tuner les bases RRD.
Attention ceci est un test. Merci de nous aider en testant ce patch apres avoir backupé les deux fichiers ods et lib/updateFunctions.pm
Une fois que qq personnes auront validé ce patch, on fera un patch officiel.
Attention, je suis parti de la version 1.4.1 officiel. Ne pas appliqué ce patch si vous avez bidouillé le code..;
Merci d'avance.
icedance
09-19-2007, 02:39 PM
premierement un grand merci.
Pour ne pas faire de bétises, il faut remplacer les fichiers existants ?
mettre ce qui trouve a l'intérieur des fichiers.patch a la suite de ce qui existe déja ?
julio
09-19-2007, 02:45 PM
arf nan... ca c'est des patch... je vais te donner les fichiers alors ca sera plus simple..
voila... t'as juste à remplacer les fichiers et à remplacer les macro au debut du fichier ods. Si tu cherche les valeurs a mettre pour ces macro, tu peux les trouver dans /etc/oreon.conf
bon courage
icedance
09-19-2007, 03:24 PM
SUPPPPPPERRRRRRRRR
ca fonctionne super bien. ( pour le moment )
Bon je donne mon retour alors :
j'ai stoppé ODS
J'ai remplacé les fichiers,
j'ai remplace les macros ( sans avoir a allé dans /etc/oreon.conf on peut les reprendre de l'ancien fichier que l'on a backupé )
j'ai redonné les bon droit sur les fichiers
j'ai suprimé et vidée et donnée ODS des services qui était bancal ( pour info j'avais que certain services de bancal et certain sans soucis )
j'ai relancé ODS
et c'est reparti comme en 40 :)
edit :
c'est comme ca : http://img338.imageshack.us/img338/7249/screenhunter12sep191431iv9.gif
c'était comme ca : http://img262.imageshack.us/img262/152/screenhunter07sep171239oj0.gif
et le rrdtool :
rrd_version = "0003"
step = 120
last_update = 1190204946
ds[traffic_out].type = "GAUGE"
ds[traffic_out].minimal_heartbeat = 240
bon bah w8 and see maintenant ...
Mais un grand merci
lowdata
09-19-2007, 04:53 PM
Ca a l'air de marche aussi ici, excepté mes services de check_disk qui m'affichent "pas de graphes associés", je vais peut etre attendre un peu. Merci du patch en tout cas.
icedance
09-20-2007, 10:18 AM
ca graffe tjrs plus aucun soucis donc ...
merci encore ...
lowdata
09-20-2007, 10:41 AM
Re.
Donc ca graphe....mais toujours avec des trous !
http://www.imagup.info/images/05/1190275905_Screenshot.png
Je suis en train de passer les ordonnancements reguliers des services a zero...cela peut t il changer quelque chose , Merci d' avance.
Autre chose, mon plugin check_snm_remote_storage ne graphe pas ! Il me sort bien les infos ca ok, mais pour chaque service crée avec il me dit pas de graphes associés" ! Savez vous d'ou cela peut t il venir ?
Tu as regenere cette base ?
lowdata
09-20-2007, 11:28 AM
wep, j'ai copié/collé les nouveaux fichier ods et updatefunctions.pm, regenerer la base te restart ODS, je me prends toujours "aucun graphe associé", alors que dans informations j'ai bien l'espace disk etc...La j'avoue ne pas comprendre :s:s
Cajiss
09-20-2007, 01:13 PM
j'ai effectué les modif indiquées plus haut, lorsque je fais /etc/init.d/ods restart il ne met : No lock file found in /usr/local/oreon/ODS/var/ods.pid
je n 'ai aucun fichier .rrd de recréer dans /var/lib/ods/database/
sur l interface, dans option-oreon-centreondatastorage, je n'ai que 4 hotes avec leurs services.
et plus aucun graph non plus.
quand vous parlez de changer les macros, pouvez vous etre plus précis ?
j'ai bien le bon path dans le fichier ods.
icedance
09-20-2007, 02:11 PM
use lib "@RRD_PERL@";
use RRDs;
use File::Copy;
my $installedPath = "@OREON_PATH@/ODS/";
il faut virer les deux @valeur@ et metre ce qui correspond a ta config.
as tu vérifié le fichier de log celui du démon
par le plus grand des hasards n'a t'il pa sorti une erreur de droit ...
si tu as remplacé le fichier en root y a des chance que ca coince
Cajiss
09-20-2007, 03:06 PM
les droits sont ok mais le ods_daemon.log me dit ca : Use of uninitialized value in concatenation (.) or string at /usr/local/oreon/ODS/lib/identifyMetric.pm line 54, <PFDT> line 4.
Use of uninitialized value in concatenation (.) or string at /usr/local/oreon/ODS/lib/identifyMetric.pm line 60, <PFDT> line 4.
Use of uninitialized value in concatenation (.) or string at /usr/local/oreon/ODS/lib/identifyMetric.pm line 64, <PFDT> line 4.
Use of uninitialized value in string ne at /usr/local/oreon/ODS/lib/identifyMetric.pm line 87, <PFDT> line 4.
voici les lignes 48 à 66 du identifyMetric.pm :
if ($1 && defined($2)){
# Check if metric is known...
$data[0] =~ s/\//#S#/g;
$data[0] =~ s/\./\-/g;
$data[0] =~ s/\,/\-/g;
$data[0] =~ s/\:/\-/g;
my $sth1 = $con_ods->prepare("SELECT * FROM `metrics` WHERE `index_id` = '".$_[1]."' AND `metric_name` = '".$data[0]."'");
if (!$sth1->execute) {writeLogFile("Error:" . $sth1->errstr . "\n");}
if ($sth1->rows() eq 0){
$just_insert = 1;
undef($sth1);
# Si pas connue -> insert
my $sth2 = $con_ods->prepare("INSERT INTO `metrics` (`index_id`, `metric_name`, `unit_name`) VALUES ('".$_[1]."', '".$data[0]."', '".$data[2]."')");
if (!$sth2->execute){writeLogFile("Error:" . $sth2->errstr . "\n");}
undef($sth2);
# Get ID
$sth1 = $con_ods->prepare("SELECT * FROM `metrics` WHERE `index_id` = '".$_[1]."' AND `metric_name` = '".$data[0]."'");
if (!$sth1->execute) {writeLogFile("Error:" . $sth1->errstr . "\n");}
}
et 76 à 92 :
# Check Storage Type
# O -> BD Mysql & 1 -> RRDTool
$begin = $_[3] - 200;
if (defined($data[1])){
if (defined($_[4]) && $_[4] eq 1 && $_[6] ne 2){
updateRrdDB($configuration->{'RRDdatabase_path'}, $metric->{'metric_id'}, $_[3], $data[1], $begin, $configuration->{'len_storage_rrd'}, $metric->{'metric_name'});
$generalcounter++;
} elsif (defined($_[4]) && $_[4] eq 0) { # Insert Data In Mysql
updateMysqlDB($metric->{'metric_id'}, $_[3], $data[1], $status{$_[2]});
$generalcounter++;
} else {
updateRrdDB($configuration->{'RRDdatabase_path'}, $metric->{'metric_id'}, $_[3], $data[1], $begin, $configuration->{'len_storage_rrd'}, $metric->{'metric_name'}) if ($_[6] ne 2);
updateMysqlDB($metric->{'metric_id'}, $_[3], $data[1], $status{$_[2]});
$generalcounter++;
}
}
$just_insert = 0;
J'avoue que c'est du chinois pour moi donc pas évident...
il me dit toujours No lock file found in /usr/local/oreon/ODS/var/ods.pid si je redémarre ods.
lowdata
09-20-2007, 03:09 PM
Tu as regenere cette base ?
Re. Wé pour signaler qu'en fait je n'ai plus mes services de disk dans la gestion de CentreonDataStorage, la ou on peut regenerer les graphes ? comment faire pour les obtenir a nouveau ? La dans chaque service de check disk (check_centreon_snmp_remote_storage) il me dit "ce service n'as pas de graphe associé".
icedance
09-20-2007, 05:39 PM
ta forcement , a mon sens, un soucis de droit
puisqu'il arrive a lancer le processus puisqu'il te retourne qu'il arrive pas a trouver la metric
si il fait pas lefichier de lock c'est que déja il a un soucis de droit.
Normalement ca il le fait dès que ODS est lancé pour la premiere fois.
Comment est ce que tu as fait le changement ?
Tu as remplacé directement ? ou ouvert les fichier et remplacé le contenu ?
Cajiss
09-21-2007, 10:26 AM
j'ai remplacé les fichiers en saugardant les anciens en .old.
ods : nagios:nagios 775 (remplacé)
updateFunction : www-data:www-data 775 (remplacé)
identifyMetric.pm : www-data:www-data 775
j'ai bien vérifié que les nouveaux aient les même droits que les anciens.
Pour moi ca foire complétement !
Voir mon post : http://forum.oreon-project.org/showthread.php?t=3163&page=2&highlight=heartbeat (à partir du post #15)
Malgrès le fait que j'ai désactivé les graphs (pour chaque service dans extended informations, je n'ai renseigné aucun type de graph) lorsque je relance ODS, tous les graphs réapparaissent (vide bien sur) !!!!
Comment désactiver un graph pour un service sans supprimer et recréer ce dernier ?
Les graphs sous centreon me depassent completement !!!!!
EDIT :
Bon je viens de désactiver "complétement" mes graphs. J'en réactive uniquement 1 (service qui se lance toute les minutes).
La base ODS se remplie bien, le rrd se créer bien (avec le bon heartbeat).
Après une bonne vingtaine de minutes, le graph s'affiche bien mais sans aucune donnée à l'intérieur. (uniquement le cadre).
Petit truc : Un service de test espace disque (check_centreon_snmp_storage) graph parfaitement alors que tous les autres types de service ne graphent plus !
Le + bizarre c'est qu'avant (jusqu'à hier matin) tous graphait nickel !
kassec
10-25-2007, 05:47 PM
Hop !
J'ai essayé de faire le tour des posts un peu partout sur les pb de graph, mais j'avoue qu'il y a beaucoup de choses et je ne suis pas certain d'avoir tout lu.
Après avoir beaucoup souffert, j'ai eu un setup qui fonctionnait pas mal pendant un temps. Le patch proposé ici (http://forum.oreon-project.org/showpost.php?p=30953&postcount=39) a aidé à stabiliser la situation pendant un temps.
Et puis, suite à une màj de conf (j'en ai fait beaucoup, impossible de dire laquelle exactement a déclanché le pb), je retombe sur un os :-(
Un coup d'oeil dans les logs ods cette après-midi (après avoir un rebuild complet des bases rrd) et je trouve des choses plutôt marrantes :
1193308632 - Get Data for rebuilding /var/lib/ods/database/176.rrd
1193308632 - Rebuild database : /var/lib/ods/database/176.rrd (interval : 360 - Len : 87600)
1193308633 - ERROR while updating /var/lib/ods/database/176.rrd at 1193241477 -> 0.82 : Not enough arguments
1193308633 - Updating : /var/lib/ods/database/539.rrd : time, 1193308619:7.290000e-01
1193308633 - ERROR while updating /var/lib/ods/database/539.rrd : Not enough arguments
1193308565 - Updating : /var/lib/ods/database/418.rrd : ok, 1193308556:1.000000e+00
1193308565 - ERROR while updating /var/lib/ods/database/106.rrd at 1193251741 -> 0.728 : Not enough arguments
1193308565 - ERROR while updating /var/lib/ods/database/418.rrd : Not enough arguments
1193308565 - Updating : /var/lib/ods/database/50.rrd : load5, 1193308559:0.000000e+00
1193308565 - ERROR while updating /var/lib/ods/database/106.rrd at 1193257394 -> 0.705 : unknown option '1193257394:0.705'
1193308565 - ERROR while updating /var/lib/ods/database/50.rrd : unknown option '1193
1193308576 - ERROR while updating /var/lib/ods/database/116.rrd at 1193264255 -> 111.48 : opening 'ok': Permission denied
1193308576 - ERROR while updating /var/lib/ods/database/12.rrd : opening 'ok': Permission denied
1193308622 - ERROR while updating /var/lib/ods/database/158.rrd at 1193304991 -> 0.49 : Not enough arguments
1193308622 - ERROR while updating /var/lib/ods/database/338.rrd : Not enough arguments
1193308565 - ERROR while updating /var/lib/ods/database/106.rrd at 1193251741 -> 0.728 : Not enough arguments
1193308565 - ERROR while updating /var/lib/ods/database/418.rrd : Not enough arguments
1193308565 - Updating : /var/lib/ods/database/50.rrd : load5, 1193308559:0.000000e+00
1193308565 - ERROR while updating /var/lib/ods/database/106.rrd at 1193257394 -> 0.705 : unknown option '1193257394:0.705'
1193321346 - ERROR while updating /var/lib/ods/database/1.rrd at 1193205179 -> 1.494 : unknown option '--template'
1193321346 - ERROR while updating /var/lib/ods/database/607.rrd : unknown option '--template'
1193321346 - ERROR while updating /var/lib/ods/database/1.rrd at 1193220182 -> 1.534 : opening 'load5': No such file or directory
1193321346 - ERROR while updating /var/lib/ods/database/53.rrd : opening 'load5': No such file or directory
1193321348 - ERROR while updating /var/lib/ods/database/2.rrd at 1193207280 -> 1 : unknown option 'ok'
1193321348 - Updating : /var/lib/ods/database/330.rrd : traffic_in, 1193308723:2.538044e+07
1193321348 - ERROR while updating /var/lib/ods/database/330.rrd : unknown DS name '?h'
bref, la reconstruction de bases semble un peu chaotique ...
Je reconnais que mon setup n'est pas simple : noms de hosts avec des '/' (pas d'espaces), des checks avec des intervalles très variables (de 30s à 30 minutes), près de 300 graphiques, des modifications faites sur les intervalles de check, etc. En revanche, je n'ai pas noté de pb de performance sur le serveur.
[accès possible sur la plateforme si souhaité pour l'équipe de dév, me contacter en privé]
edit:
Et j'ai le process ods qui plante aussi de temps en temps:
root@monitor01:~# ps -edf | grep -i ods
root 3828 5302 0 23:28 pts/0 00:00:00 grep -i ods
root@monitor01:~# /etc/init.d/ods restart
Stopping ODS Collector : ods
/etc/init.d/ods: line 60: kill: (24495) - No such process
Waiting for ods to exit . done.
Error : /usr/local/oreon/ODS/var/ods.pid already Exists.
But no ods process runnig
Removing ods pid file
Starting ODS Collector : ods
root@monitor01:~# ps -edf | grep -i ods
root 6122 5302 0 23:28 pts/0 00:00:00 grep -i ods
root@monitor01:~# cd /usr/local/oreon/ODS/var
root@monitor01:/usr/local/oreon/ODS/var# tail ods.log
1193342962 - Updating : /var/lib/ods/database/135.rrd : time, 1193342944:7.640000e-01
1193342962 - ERROR while updating /var/lib/ods/database/135.rrd : Not enough arguments
1193342962 - Updating : /var/lib/ods/database/338.rrd : traffic_in, 1193342951:3.044193e+07
1193342962 - ERROR while updating /var/lib/ods/database/137.rrd at 1193258589 -> 0.733 : opening 'traffic_in': No such file or directory
1193342962 - ERROR while updating /var/lib/ods/database/338.rrd : opening 'traffic_in': No such file or directory
1193347697 - Starting ODS engine...
1193347697 - PID : 5396
1193347697 - Rebuild Graphs for Services : 57
1193347697 - Get Data for rebuilding /var/lib/ods/database/139.rrd
1193347697 - Rebuild database : /var/lib/ods/database/139.rrd (interval : 180 - Len : 175200)
root@monitor01:/usr/local/oreon/ODS/var#
kassec
10-26-2007, 06:31 PM
Tiens, aujourd'hui j'ai de nouvelles erreurs quand je demande des rebuilds rrd :
Use of uninitialized value in multiplication (*) at /usr/local/oreon/ODS/ods line 383.
thread failed to start: Illegal division by zero at /usr/local/oreon/ODS/ods line 396.
...
Bug report (http://bugs.oreon-project.org/?do=details&id=427)
marrant
depuis que j'ai appliqué le "patch", les graphs marchent sans souci sauf pour les graph réseau.
J'ai un beau graph réseaux pour les machines linux mais des point éparpillés pour les serveurs windows....
space
edit : autant pour moi, c'est reparti comme en 40 après un redémarrage du serveur=)
Poulpatine
10-30-2007, 04:36 PM
Bonjour à vous.
Je tourne sous Centre 1.4.1 et j'ai installé les 2 fichiers patchés pour ODS, malheureusement les graphs ne fonctionnent pas.
Lorsque je vais consulter les graphes d'un hôte, j'ai 4 rubriques qui apparaissent mais seule la rubrique "Verification du CPU" contient un graphe qui de toute façon est vide.
Auparavant les graphes fonctionnaient correctement ( si ce n'est que quelquefois, ods se mettait à bouffer 100% du CPU :-/ ).
Je précise que je suis parti d'une base vide ( que j'ai vidé pour l'occasion ). J'ai aussi supprimé les anciens fichiers .rrd .
Que faire ?
Merci à vous :)
Voici mon fichier ods_demon.log :
...
Use of uninitialized value in string ne at /opt/oreon/ODS/lib/identifyMetric.pm line 87, <PFDT> line 11.
Use of uninitialized value in string ne at /opt/oreon/ODS/lib/identifyMetric.pm line 87, <PFDT> line 11.
Use of uninitialized value in string ne at /opt/oreon/ODS/lib/identifyMetric.pm line 87, <PFDT> line 11.
Le fichier ods.log ne contient pas d'erreurs par contre.
edit : voici la page de configuration des graphes, tout ça me parait assez bizarre :
http://img340.imageshack.us/img340/2204/screenshot051ud0.th.jpg (http://img340.imageshack.us/my.php?image=screenshot051ud0.jpg)
Poulpatine
11-05-2007, 11:09 AM
Après une petite investigation, j'ai bien l'impression que ce sont les plugins dont la sortie "performance data" contient des quotes qui ne sont pas traités :-/ .
Une solution ??
xoroz
03-26-2008, 10:57 AM
I am sorry but I dont understand french very well.
I am trying to apply the ODS patch.
I dont understand the step.
I suprimé and emptied ODS and data services that ...
Should I delete all .rrd file from /usr/local/oreon/OreonDataStorage/ ?
Will I lose the old graphs if I do that??
Thanks,
Je suis désolé mais je ne comprends très bien français.
J'essaie d'appliquer le patch SACO.
Je ne le comprends pas.
Je suprimé et vidés ODS et des services de données que ...
Devrais-je supprimer tous. Rrd fichier à partir de / usr / local / oreon / OreonDataStorage /?
Vais-je perdre les anciens graphiques si je ne fais que?
Merci,