View Full Version : Graphs du satellite interrompus
pateretou
11-13-2008, 08:17 PM
Salut à tous,
j'ai une archi avec un serveur nagios centralisé et un serveur satellite.
Jusque là, pas de problèmes.
J'ai mis à jour avec la RC7 récemment et depuis, les perfs de mon serveur satellite ne sont plus graphés.
J'ai un peu cherché dans tous les sens et je ne comprends pas trop d'ou ça peut venir.
D'autant plus que les serveurs monitorés par le satellite le sont toujours (si je le coupe l'information remonte immédiatement à mon serveur central). Donc il y a bien une communication entre les deux serveurs.
Si je snif sur mon serveur central sur le port 5668, je vois bien des packets passer avec les infos sur mes serveurs.
Si je mets ndo2db en mode débug sur le serveur central, je vois bien des requetes SQL concernant mes hosts monitorés par le satellite.
Mes hosts monitorés par le serveur central sont bien graphés.
Bref, je ne comprends pas comment les infos de monitoring peuvent remonter mais pas les infos de perf qui servent à grapher!
Mes fichiers RRD des serveurs distants n'ont pas été modifiés depuis la date de maj en RC7.
Quel process fait la mise à jour des RRD? En utilisant la base?
Il me semblait que c'était centcore mais je n'en suis plus sur du coup
Si quelqu'un à une idée de génie?
naparuba
11-14-2008, 09:37 AM
C'est un process qui va récupérer les infos de perf en scp puis l'intègre. Tu n'aurait pas un service Cent* d'arrété?
pateretou
11-14-2008, 12:19 PM
Merci pour ta réponse! :)
Non les process tournent bien:
Sur le serveur principal:
# ps aux | grep cent
nagios 12700 0.0 0.1 7896 3372 ? S Nov12 0:00 /usr/bin/perl -w /usr/local/centreon/bin/centstorage
nagios 14516 0.0 0.1 6312 3572 ? SN Nov13 0:00 /usr/bin/perl -w /usr/local/centreon/bin/centcore
root 20061 0.0 0.0 2856 788 pts/0 S+ 10:37 0:00 grep --colour=auto cent
Sur le satellite:
# ps aux | grep cent
nagios 11425 0.0 0.0 25872 6328 ? SN Nov13 0:00 /usr/bin/perl -w /usr/local/centreon/bin/centcore
je soupconne un pb de droit avec le centcore.cmd.
vous pouvez me faire un ls -l sur vos serveur?
principal:
# ll
total 64
prwxrwxrwx 1 nagios nagios 0 2008-11-12 12:36 centcore.cmd
prwxrwxrwx 1 nagios nagios 0 2008-11-14 10:51 centcore.cmd_read
drwxrwxr-x 2 nagios nagios 4096 2008-07-11 18:50 centplugins
drwxr-xr-x 3 nagios nagios 4096 2008-09-12 17:41 log
drwxr-xr-x 2 nagios nagios 28672 2008-11-12 17:47 metrics
drwxrwxr-x 4 nagios nagcmd 4096 2008-09-12 17:45 nagios-perf
drwxr-xr-x 3 nagios nagios 4096 2008-09-12 17:41 perfdata
drwxr-xr-x 2 nagios nagios 20480 2008-11-10 19:08 status
satellite:
# ll
total 0
prwxrwxrwx 1 nagios nagios 0 2008-11-12 13:13 centcore.cmd_read
prwxrwxrwx 1 nagios nagios 0 2008-11-12 13:12 centcore.cmd_read.save
drwxrwxr-x 2 nagios nagios 48 2008-09-11 12:08 centplugins
drwxr-xr-x 2 nagios nagios 48 2008-09-11 12:06 metrics
drwxrwxr-x 3 nagios nagcmd 80 2008-09-11 16:20 nagios-perf
drwxr-xr-x 2 nagios nagios 48 2008-09-11 12:06 status
C'est le centcore du serveur principale qui est sensé prendre le /usr/local/nagios/var/service-perfdata de mon satellite en scp?
naparuba
11-14-2008, 12:54 PM
Sur le principal j'ai:
-rw-r--r-- 1 apache apache 10 Oct 28 16:42 centcore.cmd_read
Il me semble que pour le rapatriement le centcore.cmd n'est pas utilisé, il n'est là que pour prendre les commandes de l'interface (je ne suis pas sûr du tout de ce point).
Normalement centcore a un temps de récupération réuglier des données de perf. Il se connecte avec le user avec lequel il est lancé, en général nagios. Tu peux toujours tenter un ssh nagios@distant et voir si ca passe bien.
Sur le principal j'ai:
-rw-r--r-- 1 apache apache 10 Oct 28 16:42 centcore.cmd_read
Il me semble que pour le rapatriement le centcore.cmd n'est pas utilisé, il n'est là que pour prendre les commandes de l'interface (je ne suis pas sûr du tout de ce point).
Normalement centcore a un temps de récupération réuglier des données de perf. Il se connecte avec le user avec lequel il est lancé, en général nagios. Tu peux toujours tenter un ssh nagios@distant et voir si ca passe bien.
D'après mon utilisation, le démon CentCore doit être lancé uniquement sur le serveur central. Quand tu généres une nouvelle configuration pour ton satellite depuis l'interface Web, le fichier centcore.cmd est mis à jour et automatiquement lu quelques secondes plus tard par le centcore.
Ensuite, il récupére les informations en base de données pour générer la configuration et la transmettre en scp au satellite (avec un nagios restart si tout ce passe bien).
Salut à tous,
j'ai une archi avec un serveur nagios centralisé et un serveur satellite.
Jusque là, pas de problèmes.
J'ai mis à jour avec la RC7 récemment et depuis, les perfs de mon serveur satellite ne sont plus graphés.
J'ai un peu cherché dans tous les sens et je ne comprends pas trop d'ou ça peut venir.
D'autant plus que les serveurs monitorés par le satellite le sont toujours (si je le coupe l'information remonte immédiatement à mon serveur central). Donc il y a bien une communication entre les deux serveurs.
Si je snif sur mon serveur central sur le port 5668, je vois bien des packets passer avec les infos sur mes serveurs.
Si je mets ndo2db en mode débug sur le serveur central, je vois bien des requetes SQL concernant mes hosts monitorés par le satellite.
Mes hosts monitorés par le serveur central sont bien graphés.
Bref, je ne comprends pas comment les infos de monitoring peuvent remonter mais pas les infos de perf qui servent à grapher!
Mes fichiers RRD des serveurs distants n'ont pas été modifiés depuis la date de maj en RC7.
Quel process fait la mise à jour des RRD? En utilisant la base?
Il me semblait que c'était centcore mais je n'en suis plus sur du coup
Si quelqu'un à une idée de génie?
Bonjour,
Ce que t'écris m'intéresse beaucoup,
moi j'ai un central avec d'installer : centcore, centstorage, centweb, un nagios (qui est volontairement arrêté)
un satellite avec d'installer : centstorage + nagios.
La génération de la config nagios pour le satellite fonctionne très bien.
Mon problème, c'est que je ne sais pas comment on peut visualiser les graphes rrd depuis le central. Car sur mon satellite, j'ai bien les fichiers rrd en local qui sont rempli. Y a t-il un scp qui fait que le central récupere les fichier .rrd ? ou peut être mon archi n'est pas bonne et je ne dois pas installer le centstorage sur le satellite mais sur le central ?
Peut être qu'a à deux on pourra déboguer les choses
Hello,
i can't read or speak french but do i understand that centcore has to be installed on a satellite to get graphs ready on the principal? This because i'm experience the problem now of not having any graphs generated at the principal but i do need them!
Nico
naparuba
12-03-2008, 10:05 AM
No. In the satelite, just Nagios, ndomod.o and ssh keys. No cent* at all. The centcore get with scp the perfdata, and give it to centstorage, but theses oretations are on the centreon host, not the satelite.
Oke, that's the configuration i have and it workes with some hosts. For example a ping graph works for one host and for another host (from the same range and location) i get no graph. It displays "Image could not be loaded (graph popup&index=<value>)"
Any ideas how i can resolve this?
Oke, that's the configuration i have and it workes with some hosts. For example a ping graph works for one host and for another host (from the same range and location) i get no graph. It displays "Image could not be loaded (graph popup&index=<value>)"
Any ideas how i can resolve this?
Hi nks,
i confirme there is not Centcore or CentStorage on satellite with my test. So I get graphs with distributed mode ! On CentWeb, I duplicate NagiosCFG, ndomodCFG and ndo2dbCFG, they are associated on my satellite. The CentCore will get serviceperfdata (by ssh) and put on the local file serviceperfdata. It will be read on centstorage to generate file RRD.
I understood the functionnality of the centcore by using the debug mode :-)
It's possible that your version number of rrdtool is incorrect. Fix it, on configuration->Option->RRDTool (it was my case)