PDA

View Full Version : centraliser la surveillance


jeyjey
26th February 2009, 09:43
Bonjour,
je voudrais centraliser la surveillance, j'ai actuellement 4 serveurs nagios et je voudrais les regrouper sur une seul interface web centreon c'est possible ???
faut-il utiliser NSCA ou NRPE pour récupérer les log ??? ou peut-on faire autrement ??
Cdlt.

AkHeNaToN
26th February 2009, 10:05
Oui Centreon offre de cette possibilité.

Centreon à un module Centstorage qui ira récupérer les logs en SSH, un module Centcore pour pousser les configuration des poller Nagios.

Pour les états des services et des hôtes, le broker NDO sera utilisé

jeyjey
26th February 2009, 10:07
c'est pour quand ???
on peut pas le faire avec la version 2.01 ??? avec des scripts ???

AkHeNaToN
26th February 2009, 10:09
depuis plusieurs mois déjà :D

fait un tour sur le Wiki c'est expliqué

jeyjey
26th February 2009, 11:01
par contre il faut que les nagios soient installés de la meme facon ?

AkHeNaToN
26th February 2009, 11:52
par contre il faut que les nagios soient installés de la meme facon ?

Je ne comprends pas ta question.

Dans l'interface de Centreon tu vas configurer tous tes poller Nagios. Il est conseillé que tous ces Nagios soit dans la même version 3.x par exemple.

jeyjey
27th February 2009, 17:16
Je ne comprends pas ta question.


j'ai actuellement 4 serveurs installés a la sauce GFI (SII) avec des fichiers conf un peu différent du standard

exemple du nagios.cfg:

cfg_dir=/opt/nagios/Config
cfg_dir=/opt/nagios/Config/Serveurs
cfg_dir=/opt/nagios/Config/GenericsTemplates
cfg_dir=/opt/nagios/Config/Contact

cfg_dir=/opt/nagios/Config/Serveurs/Unix
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Groups

cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/Groups
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/8
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/8/templates
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/10-Global
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/10-Global/templates
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/10-Container
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/10-Container/templates
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/localhost
cfg_dir=/opt/nagios/Config/Serveurs/Unix/Solaris/localhost/templates


j'ai donc suivi le wiki

je connecte bien sur mon poller via ssh -> c'est OK
j'ai déclaré sous centreon le poller avec les bon path -> c'est OK
et quand je lance le centcore j'ai ca !


Use of uninitialized value $distantperffile in concatenation (.) or string at /usr/share/centreon/bin/centcore line 292.
Use of uninitialized value $distantperffile in concatenation (.) or string at /usr/share/centreon/bin/centcore line 306.
Use of uninitialized value $distantperffile in concatenation (.) or string at /usr/share/centreon/bin/centcore line 312.
mv: illegal option -- o
mv: illegal option -- l
mv: illegal option -- d
mv: Insufficient arguments (0)
Usage: mv [-f] [-i] f1 f2
mv [-f] [-i] f1 ... fn d1
mv [-f] [-i] d1 d2

je pense qu'il veux recopier un fichier $distantperffile ... qui se trouve ou normalement ???

AkHeNaToN
27th February 2009, 17:19
ton fichier service-perfdata ne doit pas avoir le bon path dans la configuration de tes poller Nagios. vérifi tous les path et nom des fichier dans les nagios.cfg

jeyjey
27th February 2009, 17:23
ca doit etre ca

service_perfdata_file=/var/run/nagios3/service-perfdata


le script récupère le fichier sur le poller ???

sur le poller
nagios.cfg

service_perfdata_file=/opt/nagios/nagios/var/perfdata/service-perfdata

AkHeNaToN
27th February 2009, 17:35
non mais Centstorage va chercher ces fichiers pour obtenir les données de performances et générer les graphs.

jeyjey
27th February 2009, 18:11
apres avoir regarder le script centcore .... il faut en fait déclarer le nagios.cfg du poller ...
le boulet ....!
le service démarre sans erreur !
par contre j'ai désactivé la conf du poller car si j'ai bien compris .... si je l'active et que je génère les conf (central + poller) le fichier nagios.cfg du poller sera écrasé ??

jeyjey
27th February 2009, 18:16
petite info le process Centstorage ... il fait quoi au juste ce process ... c'est lui qui alimente la base ndoutils ??? et qui permet de voir les serveurs du poller sur l'interface centreon ?

AkHeNaToN
27th February 2009, 18:17
oui elle sera écrasée.

Cependant, tu peux ne générer la conf que poller par poller (en ayant quand même la possibilité de tout faire d'un coup).

jeyjey
27th February 2009, 18:31
c'est ce que je pensais ...

en regardant les logs centstorage.log et centAcl.log
j'ai un message dans centAcl.log :

DB Error : DELETE FROM `centreon_acl` WHERE `group_id` = '14' [nativecode=1146 ** Table 'ndoutils.centreon_acl' doesn't exist]<br />XXXX@XXXXXXX:/var/log/centreon$

j'ai un autre message aussi qui s'affiche dans mon xterm :
cat: erreur d'écriture: Aucun espace disponible sur le périphérique
qui doit provenir du process centcore ?

et je n'ai rien de plus sous centreon que mon localhost ....

quelqu'un a t-il déjà utilisé les utilitaires log2ndo et file2sock pour intégrer les hosts dans la base NDO ....

dans la log nagios j' ai un message

ndomod: Still unable to reconnect to data sink.
quelqu'un a déjà eu le problème ???

jeyjey
2nd March 2009, 12:31
bonjour,
besoin d'un petit eclairessisement ....pour que le poller envoie c'est info il faut q'un deuxieme process ndo2db tourne sur le serveur central ????
on devrait avoir sur le serveur central un process ndo2db en local (pour le nagios maitre socket unix) et un autre process ndo2db (pour le poller socket tcp) ????

AkHeNaToN
2nd March 2009, 13:02
le mieux est un socket TPC unique et tous les Nagios lui envoit leurs infos

jeyjey
2nd March 2009, 13:27
sur le server central j'ai changé le type de socket en tcp : tout est OK


[1235992605] Caught SIGTERM, shutting down...
[1235992605] Successfully shutdown... (PID=8828)
[1235992605] ndomod: Shutdown complete.
[1235992605] Event broker module '/usr/sbin/ndomod.o' deinitialized successfully .
[1235992605] Nagios 3.0.2 starting... (PID=8904)
[1235992605] Local time is Mon Mar 02 12:16:45 CET 2009
[1235992605] LOG VERSION: 2.0
[1235992605] ndomod: NDOMOD 1.4b7 (10-31-2007) Copyright (c) 2005-2007 Ethan Gal stad (nagios@nagios.org)
[1235992605] ndomod: Successfully connected to data sink. 0 queued items to flu sh.
[1235992605] Event broker module '/usr/sbin/ndomod.o' initialized successfully.
[1235992605] Finished daemonizing... (New PID=8906)



par contre sur un des poller c'est pas bon :



[1235992605] ndomod: NDOMOD 1.4b7 (10-31-2007) Copyright (c) 2005-2007 Ethan Gal stad (nagios@nagios.org)
[1235992605] ndomod: Could not open data sink! I'll keep trying, but some output may get lost ....
[1235992605] Event broker module '/opt/nagios/ndoutils/bin/ndomod.o' initialized successfully.

AkHeNaToN
2nd March 2009, 13:36
la configuration des fichiers ndomod.cfg des pollers ont été bien modifiée elles aussi ?

jeyjey
2nd March 2009, 13:49
oui

ndomod.cfg du central

pwd
/etc/centreon/filesGeneration/nagiosCFG/1#cat ndomod.cfg
instance_name=Central
output_type=tcpsocket
output=localhost
tcp_port=5668
output_buffer_items=5000
file_rotation_interval=14400
file_rotation_timeout=60
reconnect_interval=15
reconnect_warning_interval=900
data_processing_options=-1
config_output_options=3


et celui du poller


pwd
/opt/nagios/ndoutils/etc#cat ndomod.cfg
instance_name=Poller1
output_type=tcpsocket
output=IP_SERVEUR_CENTRAL
tcp_port=5668
output_buffer_items=5000
file_rotation_interval=14400
file_rotation_timeout=60
reconnect_interval=15
reconnect_warning_interval=15
data_processing_options=-1
config_output_options=3


et IP_SERVEUR_CENTRAL est remplacé par l'ip du serveur nagios central

AkHeNaToN
2nd March 2009, 13:58
Pas de firewall qui bloque le flux 5668 entre le poller et le Central ?

Pas de firewall "iptables" sur le central pour le flux 5668 TCP entrant ?

jeyjey
2nd March 2009, 14:05
non pas de firewall et de firewall "iptables" . quel test peut-on faire pour voir si le flux 5668 TCP est disponible ???

j'ai fait une capture des utilisateurs connectés sur la base , c'est l'utilisateur ndoutils qui récupère les infos des pollers et qui alimente la base ndoutils ????
http://nsa05.casimages.com/img/2009/03/02/mini_090302010609112753.jpg (http://www.casimages.com/img.php?i=090302010609112753.jpg)

car l'utilisateur ndoutils en localhost est toujours en sleep !


j'ai fait un test en me mettant sur le poller j'ai fait un log2ndo -s /opt/nagios/nagios/var/nagios.log -d mon_serveur_central -t tcp -p 5668 -i nom_de_l'instance
et en regardant dans la base ndo du central je recupère bien les logs dans la table nagios_logentries
et dans la table nagios_instances je retrouve bien les noms des instances .

jeyjey
3rd March 2009, 16:12
ca marche presque .... je récupère bien les fichiers de log des différentes instances ....
par contre sous centreon je n'ai qu'une seul instance qui remote !!! c'est le script loganalyser qui doit alimenter la base centreon ????
/usr/share/centreon/bin# ls -Rltr /var/lib/centreon/log/
/var/lib/centreon/log/:
total 16
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 2
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 3
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 4
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 5

/var/lib/centreon/log/2:
total 1444
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 1469321 2009-03-03 15:08 nagios.log

/var/lib/centreon/log/2/archives:
total 0

/var/lib/centreon/log/3:
total 1036
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 1051087 2009-03-03 15:06 nagios.log

/var/lib/centreon/log/3/archives:
total 0

/var/lib/centreon/log/4:
total 1648
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 1676033 2009-03-03 15:06 nagios.log

/var/lib/centreon/log/4/archives:
total 0

/var/lib/centreon/log/5:
total 5512
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 5627233 2009-03-03 15:06 nagios.log

/var/lib/centreon/log/5/archives:
total 0



et c'est normal ca ???
http://nsa05.casimages.com/img/2009/03/03/mini_09030303193849601.jpg (http://www.casimages.com/img.php?i=09030303193849601.jpg)

jeyjey
3rd March 2009, 16:42
??? personne ????

AkHeNaToN
3rd March 2009, 16:45
Les informations de l'encadré en haut à droite proviennent de ndo.
Celles de l'interface tactical overview et monitoring proviennent de loganalyser et centstorage.

=> tous tes pollers ne renvoient pas les infos vers ndo2db (error datasink)
=> peut être des problèmes d'échanges de clés SSH pour l'utilisateur nagios vers les pollers pour récupérer les fichiers services-perfdata et nagios.log

jeyjey
4th March 2009, 10:45
pour ssh je pense pas !
Ci dessous un "ls -Rltr" du repertoire le log centreon
On voit que les fichiers on bien tous la date du jour .

ls -Rltr
total 20
drwxrwxr-x 7 nagios nagios 4096 2009-02-26 11:45 nagios-perf
drwxr-xr-x 6 nagios nagios 4096 2009-02-27 11:06 perfdata
drwxr-xr-x 6 nagios nagios 4096 2009-02-27 11:06 log
drwxr-xr-x 2 nagios nagios 4096 2009-02-27 11:07 status
drwxr-xr-x 2 nagios nagios 4096 2009-02-27 11:07 metrics
./nagios-perf:
total 20
drwxrwxr-x 2 nagios nagios 4096 2009-02-25 12:20 perfmon-1
drwxrwxr-x 2 nagios nagios 4096 2009-02-27 16:50 perfmon-2
drwxrwxr-x 2 nagios nagios 4096 2009-03-02 08:55 perfmon-3
drwxrwxr-x 2 nagios nagios 4096 2009-03-03 10:10 perfmon-4
drwxrwxr-x 2 nagios nagios 4096 2009-03-03 10:10 perfmon-5
./nagios-perf/perfmon-1:
total 1476
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_services_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_hosts_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_cmd_buffer.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_service_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_execution.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_host_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_execution.rrd
./nagios-perf/perfmon-2:
total 1476
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_services_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_hosts_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_cmd_buffer.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_service_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_execution.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_host_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_execution.rrd
./nagios-perf/perfmon-3:
total 1476
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_services_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_hosts_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_cmd_buffer.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_service_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_execution.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_host_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_execution.rrd
./nagios-perf/perfmon-4:
total 1476
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_services_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_hosts_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_cmd_buffer.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_service_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_execution.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_host_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_execution.rrd
./nagios-perf/perfmon-5:
total 1476
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_services_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_hosts_states.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_cmd_buffer.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_service_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_service_execution.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_latency.rrd
-rw-r--r-- 1 nagios nagios 194344 2009-03-04 09:25 nagios_active_host_last.rrd
-rw-r--r-- 1 nagios nagios 145872 2009-03-04 09:25 nagios_active_host_execution.rrd
./perfdata:
total 16
drwxr-xr-x 2 nagios nagios 4096 2009-02-27 16:59 2
drwxr-xr-x 2 nagios nagios 4096 2009-03-02 08:50 3
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 10:08 4
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 10:17 5
./perfdata/2:
total 8
-rw-r--r-- 1 nagios nagios 4790 2009-03-04 09:25 service-perfdata
./perfdata/3:
total 12
-rw-r--r-- 1 nagios nagios 9365 2009-03-04 09:25 service-perfdata
./perfdata/4:
total 4
-rw-r--r-- 1 nagios nagios 2901 2009-03-04 09:25 service-perfdata
./perfdata/5:
total 28
-rw-r--r-- 1 nagios nagios 27678 2009-03-04 09:25 service-perfdata
./log:
total 16
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 2
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 3
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 4
drwxr-xr-x 3 nagios nagios 4096 2009-03-03 14:38 5
./log/2:
total 920
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 932114 2009-03-04 09:25 nagios.log
./log/2/archives:
total 0
./log/3:
total 500
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 501119 2009-03-04 09:25 nagios.log
./log/3/archives:
total 0
./log/4:
total 1084
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 1099497 2009-03-04 09:25 nagios.log
./log/4/archives:
total 0
./log/5:
total 2744
drwxr-xr-x 2 nagios nagios 4096 2009-03-03 14:38 archives
-rw-r--r-- 1 nagios nagios 2800984 2009-03-04 09:25 nagios.log

./log/5/archives:
total 0
./status:
total 4080
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 5.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 3.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 2.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:17 4.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-04 09:24 1.rrd
./metrics:
total 8160
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 9.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 10.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 6.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 5.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 4.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:14 3.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:17 8.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-03 10:17 7.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-04 09:24 2.rrd
-rw-r--r-- 1 nagios nagios 830176 2009-03-04 09:24 1.rrd


et pour ndo2db les 4 serveurs sont identiques , il y a un process sur chaque serveur
et un seul remonte !

ps -ef | grep ndo
nagios 6291 28535 0 09:32:19 pts/4 0:00 grep ndo
nagios 8042 13498 0 09:56:14 ? 0:00 /opt/nagios/ndoutils/bin/ndo2db-2x -c /opt/nagios/ndoutils/etc/ndo2db.cfg

jeyjey
4th March 2009, 12:05
j'ai bien trouvé ca :

ndomod
Problem: ndomod: Could not open data sink! I'll keep trying, but some output may get lost...
Still unable to connect to data sink. 0 items lost, 492 queued items to flush
Solution : Check path spelled correctly in configuration file
vi /usr/local/nagios/etc/ndomod.cfg
output=/usr/local/nagios/var/ndo.sock
buffer_file=/usr/local/nagios/var/ndomod.tmp

sur ce site http://gowrina.blogspot.com/2008/05/nagios-plugins-installation-problems.html
mais j'ai re-vérifié et tout en bon .... je vois pas .... !

jeyjey
11th March 2009, 20:49
c'est bon ca fonctionne je pensais que c'était a cause d'une mauvaise compilation sur SunOS ... mais en fait c'etait pas ca ....un mauvais conf dans nagios.cfg quel boulet !!!
Merci