![]() |
|
|||||||
| Nagios For all question Concerning Nagios |
![]() |
|
|
Thread Tools | Display Modes |
|
#1
|
|||
|
|||
|
Bonjour,
J'ai récemment relancé Nagios en cochant "Reload" au lieu de "Restart". Tout avait l'air de fonctionner correctement, seulement maintenant, lors d'un redémarrage, j'ai cette erreur : Code:
Warning: Duplicate definition found for service 'ping' on host 'Routeur-7301' (config file '/usr/share/centreon/filesGeneration/nagiosCFG/1/services.cfg', starting on line 3566) Code:
Warning: Duplicate definition found for service 'ping' on host 'Routeur-7301' (config file 'etc/nagios/services.cfg', starting on line 3566) J'ai tenté un redémarrage du serveur, et au bout de 20 minutes, nagios est toujours en démarrage : Code:
root 3081 0.0 0.0 4752 1396 ? S 14:42 0:00 /bin/sh /etc/rc3.d/S99nagios start Code:
top - 15:02:52 up 21 min, 1 user, load average: 7.27, 6.42, 4.38 De plus, le fichier nagios.cmd met un temps fou à se créer. J'avais déjà remarque que si Nagios redémarrait avec un warning (pas de service associé ou autre), çà plantait le système pendant un certain temps, puis c'était de nouveau accessible. Il y a t-il un moyen de détecter le doublon en regardant dans le base de données ? Est-il possible que des warning ralentissent Centreon ? La version utilisée est la 2.0.2, sur FAN. Merci de votre aide. |
|
#2
|
|||
|
|||
|
A tu bien vérifier que le host Routeur-7301 n'avait pas de service du nom "ping" en doublon ?
Pense bien a regarder dans tes templates !
__________________
"Un problème sans solution est un problème mal posé." Albert Einstein. |
|
#3
|
|||
|
|||
|
Oui, en plus j'ai eu ce werning sur d'autres équipements, qui étaient ajouté depuis longtemps et dont je n'ai jamais ajouté de service.
Mais en ce moment, nagios ne veut plus démarrer. Il reste bloqué sur le process de démarrage comme me le montre un ps aux | grep nagios Code:
root 3084 0.0 0.0 4752 1388 ? S 16:29 0:00 /bin/sh /etc/rc3.d/S99nagios start Je suis sacrément dans la m.... le serveur étant en prod |
|
#4
|
|||
|
|||
|
J'ai refait le test parce que Centreon était de nouveau planté.
J'ai redémarré mysqld et l'affichage des pages Centreon est de nouveau plus rapide. Nagios est lancé et le monitoring a fonctionné 5 min. Par contre, pas de monitoring dans Centreon. Que des 0 partout ??? Dès que j'ai redémarré mysql, le fichier nagios.cmd s'est immédiatement crée. Même l'accès aux liens des hôtes dans Nagios est lent |
|
#5
|
|||
|
|||
|
ndo2db est fonctionnel ?
__________________
Syslog Module Team Centreon E2S developper App: Nagios 3.2.1 / NDO SVN / Centreon 2.1.8 / Centreon-Syslog 1.3.2 / Centreon E2S 1.1-RC2 OS: Ubuntu / Debian / CentOS |
|
#6
|
|||
|
|||
|
Apparement, oui.
j'ai fais un restart, et même problème, çà va faire 10 minutes que j'ai çà : Code:
nagios 9087 0.0 0.2 11452 5952 ? S 17:07 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser root 9118 0.0 0.0 4948 1372 ? S 17:07 0:00 /bin/sh /etc/init.d/nagios restart root 9149 0.0 0.0 4572 1288 ? S 17:07 0:00 /bin/sh /etc/init.d/nagios start nagios 9182 0.0 0.1 5468 3144 ? S 17:08 0:00 /usr/bin/nagios -d /etc/nagios/nagios.cfg nagios 9183 0.0 0.0 7324 1724 ? S 17:08 0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg nagios 9185 0.0 0.0 5872 1496 ? S 17:08 0:00 crond nagios 9189 0.0 0.0 2412 876 ? Ss 17:08 0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1 nagios 9190 0.0 0.2 11452 5988 ? S 17:08 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser nagios 9218 0.0 0.0 5872 1496 ? S 17:09 0:00 crond nagios 9220 0.0 0.0 2412 884 ? Ss 17:09 0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1 nagios 9221 0.0 0.2 11452 5992 ? S 17:09 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser nagios 9246 0.0 0.0 5872 1496 ? S 17:10 0:00 crond nagios 9255 0.0 0.0 2412 880 ? Ss 17:10 0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1 nagios 9258 0.0 0.2 11452 5952 ? S 17:10 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser nagios 9304 0.0 0.0 5872 1496 ? S 17:11 0:00 crond nagios 9306 0.0 0.0 2412 880 ? Ss 17:11 0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1 nagios 9307 0.1 0.2 11452 5956 ? S 17:11 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser nagios 9337 0.0 0.0 5872 1496 ? S 17:12 0:00 crond nagios 9338 0.0 0.0 5872 1496 ? S 17:12 0:00 crond nagios 9341 0.0 0.0 2412 872 ? Ss 17:12 0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1 nagios 9342 0.1 0.2 11452 5940 ? S 17:12 0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser nagios 9343 0.0 0.0 2412 952 ? Ss 17:12 0:00 /bin/sh -c /usr/bin/php -q /usr/share/centreon/cron/centAcl.php >> /var/log/centreon/centAcl.log 2>&1 nagios 9345 1.0 0.4 25448 12056 ? S 17:12 0:00 /usr/bin/php -q /usr/share/centreon/cron/centAcl.php nagios 9357 0.0 0.2 14592 5532 ? S 17:12 0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage root 9363 0.0 0.0 3952 764 pts/0 S+ 17:12 0:00 grep nagios |
|
#7
|
|||
|
|||
|
Je viens de rebooter le serveur.
- Pas de fichier nagios.cmd - Dans Centreon, tout à 0 sauf les services, 171 sur 900, avec un qui s'ajoute de temps en temps dans le statut. Mais sur la page d'accueil, ils apparaissent en disabled Résultat de ps aux | grep nagios Code:
nagios 2799 0.0 0.2 12864 5396 ? SN 17:34 0:00 /usr/bin/perl -w /usr/share/centreon/bin/centcore nagios 2837 0.0 0.1 9684 3408 ? S 17:34 0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage nagios 2957 0.0 0.0 6784 416 ? Ss 17:34 0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg root 3079 0.0 0.0 4752 1452 ? S 17:34 0:00 /bin/sh /etc/rc3.d/S99nagios start nagios 3117 0.0 0.1 5204 2768 ? S 17:34 0:00 /usr/bin/nagios -d /etc/nagios/nagios.cfg nagios 3118 0.0 0.0 7324 1672 ? S 17:34 0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg nagios 3157 0.0 0.2 14724 5856 ? S 17:35 0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage nagios 3456 0.1 0.2 14728 5692 ? S 17:35 0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage root 5190 0.0 0.0 3952 752 pts/0 S+ 17:41 0:00 grep nagios Code:
Threads: 10 Questions: 9422 Slow queries: 27 Opens: 82 Flush tables: 1 Open tables: 63 Queries per second avg: 29.352 |
|
#8
|
|||
|
|||
|
J'ai çà sinon dans les log nagios
Code:
[1269189058] Caught SIGTERM, shutting down... [1269189058] Successfully shutdown... (PID=9493) [1269189058] ndomod: Shutdown complete. [1269189058] Event broker module '/usr/lib/nagios/ndomod.o' deinitialized successfully. [1269189287] Nagios 3.0.6 starting... (PID=3117) [1269189287] Local time is Sun Mar 21 17:34:47 CET 2010 [1269189287] LOG VERSION: 2.0 [1269189287] ndomod: NDOMOD 1.4b8 (07-16-2009) Copyright (c) 2009 Nagios Core Development Team and Community Contributors [1269189287] ndomod: Successfully connected to data sink. 5000 queued items to flush. 5000 ???, c'est pas un peu beaucoup çà ? D'ailleurs, à quoi çà correspond ? Je suis passé de 171 à 247... |
|
#9
|
|||
|
|||
|
Voilà maintenant 35 min que le serveur est rebooté. toujours rien.
Par contre côté MySQL, çà bouge Code:
Threads: 22 Questions: 30623 Slow queries: 228 Opens: 210 Flush tables: 1 Open tables: 64 Queries per second avg: 14.357 Une idée ? |
|
#10
|
|||
|
|||
|
Apparemment Centstorage consomme pas mal de ressources MySQL.
Il doit avoir pas mal de travail à faire. Cette fois, la connexion de Nagios à NDO2DB à l'air de bien se passer (2 processus visible). le nombre de processus ndo2dn doit être : 1 + 1/serveur Nagios. Patiente un peu et regarde su au bout d'une heure tu as tous tes hôtes et tous tes services.
__________________
Syslog Module Team Centreon E2S developper App: Nagios 3.2.1 / NDO SVN / Centreon 2.1.8 / Centreon-Syslog 1.3.2 / Centreon E2S 1.1-RC2 OS: Ubuntu / Debian / CentOS |
![]() |
| Thread Tools | |
| Display Modes | |
|
|