Centreon Forum  

Go Back   Centreon Forum > Centreon Use > Nagios

Nagios For all question Concerning Nagios

Reply
 
Thread Tools Display Modes
  #1  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default Erreur au redémarrage de Nagios

Bonjour,

J'ai récemment relancé Nagios en cochant "Reload" au lieu de "Restart".

Tout avait l'air de fonctionner correctement, seulement maintenant, lors d'un redémarrage, j'ai cette erreur :

Code:
Warning: Duplicate definition found for service 'ping' on host 'Routeur-7301' (config file '/usr/share/centreon/filesGeneration/nagiosCFG/1/services.cfg', starting on line 3566)
Par contre si je lance nagios -v en CLI, j'ai pas tout à fait la même erreur :

Code:
Warning: Duplicate definition found for service 'ping' on host 'Routeur-7301' (config file 'etc/nagios/services.cfg', starting on line 3566)
J'ai beau regarder dans le conf, je n'ai pas de doublons.

J'ai tenté un redémarrage du serveur, et au bout de 20 minutes, nagios est toujours en démarrage :

Code:
root      3081  0.0  0.0   4752  1396 ?        S    14:42   0:00 /bin/sh /etc/rc3.d/S99nagios start
Avec une charge assez importante
Code:
top - 15:02:52 up 21 min,  1 user,  load average: 7.27, 6.42, 4.38
L'affichage dans Centreon est très très long, mais pas dans Nagios.

De plus, le fichier nagios.cmd met un temps fou à se créer.

J'avais déjà remarque que si Nagios redémarrait avec un warning (pas de service associé ou autre), çà plantait le système pendant un certain temps, puis c'était de nouveau accessible.

Il y a t-il un moyen de détecter le doublon en regardant dans le base de données ?

Est-il possible que des warning ralentissent Centreon ?

La version utilisée est la 2.0.2, sur FAN.

Merci de votre aide.
Reply With Quote
  #2  
Old 21st March 2010
SoukoussMan SoukoussMan is offline
Junior Member
Oreonistes
 
Join Date: Jan 2009
Location: Gargenville (78)
Age: 26
Posts: 17
Default

A tu bien vérifier que le host Routeur-7301 n'avait pas de service du nom "ping" en doublon ?
Pense bien a regarder dans tes templates !
__________________
"Un problème sans solution est un problème mal posé."
Albert Einstein.
Reply With Quote
  #3  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

Oui, en plus j'ai eu ce werning sur d'autres équipements, qui étaient ajouté depuis longtemps et dont je n'ai jamais ajouté de service.

Mais en ce moment, nagios ne veut plus démarrer. Il reste bloqué sur le process de démarrage comme me le montre un ps aux | grep nagios

Code:
root      3084  0.0  0.0   4752  1388 ?        S    16:29   0:00 /bin/sh /etc/rc3.d/S99nagios start
Tout à l'heure j'ai redémarré MySQL et bizarrement les pages Centreon s'affichaient instantanément. Mais toujours pas de monitoring.

Je suis sacrément dans la m.... le serveur étant en prod
Reply With Quote
  #4  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

J'ai refait le test parce que Centreon était de nouveau planté.

J'ai redémarré mysqld et l'affichage des pages Centreon est de nouveau plus rapide.

Nagios est lancé et le monitoring a fonctionné 5 min. Par contre, pas de monitoring dans Centreon. Que des 0 partout ???

Dès que j'ai redémarré mysql, le fichier nagios.cmd s'est immédiatement crée.

Même l'accès aux liens des hôtes dans Nagios est lent
Reply With Quote
  #5  
Old 21st March 2010
AkHeNaToN AkHeNaToN is offline
Administrator
Gourou
 
Join Date: Jul 2008
Location: France - Val de Marne (94)
Posts: 2,443
Default

ndo2db est fonctionnel ?
__________________
Syslog Module Team
Centreon E2S developper
App: Nagios 3.2.1 / NDO SVN / Centreon 2.1.8 / Centreon-Syslog 1.3.2 / Centreon E2S 1.1-RC2
OS: Ubuntu / Debian / CentOS
Reply With Quote
  #6  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

Apparement, oui.

j'ai fais un restart, et même problème, çà va faire 10 minutes que j'ai çà :

Code:
nagios    9087  0.0  0.2  11452  5952 ?        S    17:07   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
root      9118  0.0  0.0   4948  1372 ?        S    17:07   0:00 /bin/sh /etc/init.d/nagios restart
root      9149  0.0  0.0   4572  1288 ?        S    17:07   0:00 /bin/sh /etc/init.d/nagios start
nagios    9182  0.0  0.1   5468  3144 ?        S    17:08   0:00 /usr/bin/nagios -d /etc/nagios/nagios.cfg
nagios    9183  0.0  0.0   7324  1724 ?        S    17:08   0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg
nagios    9185  0.0  0.0   5872  1496 ?        S    17:08   0:00 crond
nagios    9189  0.0  0.0   2412   876 ?        Ss   17:08   0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1
nagios    9190  0.0  0.2  11452  5988 ?        S    17:08   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
nagios    9218  0.0  0.0   5872  1496 ?        S    17:09   0:00 crond
nagios    9220  0.0  0.0   2412   884 ?        Ss   17:09   0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1
nagios    9221  0.0  0.2  11452  5992 ?        S    17:09   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
nagios    9246  0.0  0.0   5872  1496 ?        S    17:10   0:00 crond
nagios    9255  0.0  0.0   2412   880 ?        Ss   17:10   0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1
nagios    9258  0.0  0.2  11452  5952 ?        S    17:10   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
nagios    9304  0.0  0.0   5872  1496 ?        S    17:11   0:00 crond
nagios    9306  0.0  0.0   2412   880 ?        Ss   17:11   0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1
nagios    9307  0.1  0.2  11452  5956 ?        S    17:11   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
nagios    9337  0.0  0.0   5872  1496 ?        S    17:12   0:00 crond
nagios    9338  0.0  0.0   5872  1496 ?        S    17:12   0:00 crond
nagios    9341  0.0  0.0   2412   872 ?        Ss   17:12   0:00 /bin/sh -c /usr/share/centreon/bin/logAnalyser >> /var/log/centreon/logAnalyser.log 2>&1
nagios    9342  0.1  0.2  11452  5940 ?        S    17:12   0:00 /usr/bin/perl -w /usr/share/centreon/bin/logAnalyser
nagios    9343  0.0  0.0   2412   952 ?        Ss   17:12   0:00 /bin/sh -c /usr/bin/php -q /usr/share/centreon/cron/centAcl.php >> /var/log/centreon/centAcl.log 2>&1
nagios    9345  1.0  0.4  25448 12056 ?        S    17:12   0:00 /usr/bin/php -q /usr/share/centreon/cron/centAcl.php
nagios    9357  0.0  0.2  14592  5532 ?        S    17:12   0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage
root      9363  0.0  0.0   3952   764 pts/0    S+   17:12   0:00 grep nagios
Reply With Quote
  #7  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

Je viens de rebooter le serveur.

- Pas de fichier nagios.cmd
- Dans Centreon, tout à 0 sauf les services, 171 sur 900, avec un qui s'ajoute de temps en temps dans le statut. Mais sur la page d'accueil, ils apparaissent en disabled

Résultat de ps aux | grep nagios

Code:
nagios    2799  0.0  0.2  12864  5396 ?        SN   17:34   0:00 /usr/bin/perl -w /usr/share/centreon/bin/centcore
nagios    2837  0.0  0.1   9684  3408 ?        S    17:34   0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage
nagios    2957  0.0  0.0   6784   416 ?        Ss   17:34   0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg
root      3079  0.0  0.0   4752  1452 ?        S    17:34   0:00 /bin/sh /etc/rc3.d/S99nagios start
nagios    3117  0.0  0.1   5204  2768 ?        S    17:34   0:00 /usr/bin/nagios -d /etc/nagios/nagios.cfg
nagios    3118  0.0  0.0   7324  1672 ?        S    17:34   0:00 /usr/sbin/ndo2db -c /etc/nagios/ndo2db.cfg
nagios    3157  0.0  0.2  14724  5856 ?        S    17:35   0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage
nagios    3456  0.1  0.2  14728  5692 ?        S    17:35   0:00 /usr/bin/perl -w /usr/share/centreon/bin/centstorage
root      5190  0.0  0.0   3952   752 pts/0    S+   17:41   0:00 grep nagios
Le statut de mysql

Code:
Threads: 10  Questions: 9422  Slow queries: 27  Opens: 82  Flush tables: 1  Open tables: 63  Queries per second avg: 29.352
En espérant que quelqu'un puisse m'aider. je ne vais plus toucher au serveur, peut-être que tout va se débloquer tout seul dans une heure ou 2, lorsque MySQL aura fini ?
Reply With Quote
  #8  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

J'ai çà sinon dans les log nagios

Code:
[1269189058] Caught SIGTERM, shutting down...
[1269189058] Successfully shutdown... (PID=9493)
[1269189058] ndomod: Shutdown complete.
[1269189058] Event broker module '/usr/lib/nagios/ndomod.o' deinitialized successfully.
[1269189287] Nagios 3.0.6 starting... (PID=3117)
[1269189287] Local time is Sun Mar 21 17:34:47 CET 2010
[1269189287] LOG VERSION: 2.0
[1269189287] ndomod: NDOMOD 1.4b8 (07-16-2009) Copyright (c) 2009 Nagios Core Development Team and Community Contributors
[1269189287] ndomod: Successfully connected to data sink.  5000 queued items to flush.
Sinon, le statut des services monte, tout doucement.

5000 ???, c'est pas un peu beaucoup çà ? D'ailleurs, à quoi çà correspond ?

Je suis passé de 171 à 247...
Reply With Quote
  #9  
Old 21st March 2010
magicbret magicbret is offline
Senior Member
Consultant
 
Join Date: Sep 2009
Location: Toulouse
Posts: 185
Default

Voilà maintenant 35 min que le serveur est rebooté. toujours rien.

Par contre côté MySQL, çà bouge

Code:
Threads: 22  Questions: 30623  Slow queries: 228  Opens: 210  Flush tables: 1  Open tables: 64  Queries per second avg: 14.357
Il semble que ce soit MySQL qui fasse tout planter ?

Une idée ?
Reply With Quote
  #10  
Old 21st March 2010
AkHeNaToN AkHeNaToN is offline
Administrator
Gourou
 
Join Date: Jul 2008
Location: France - Val de Marne (94)
Posts: 2,443
Default

Apparemment Centstorage consomme pas mal de ressources MySQL.

Il doit avoir pas mal de travail à faire.

Cette fois, la connexion de Nagios à NDO2DB à l'air de bien se passer (2 processus visible).

le nombre de processus ndo2dn doit être : 1 + 1/serveur Nagios.

Patiente un peu et regarde su au bout d'une heure tu as tous tes hôtes et tous tes services.
__________________
Syslog Module Team
Centreon E2S developper
App: Nagios 3.2.1 / NDO SVN / Centreon 2.1.8 / Centreon-Syslog 1.3.2 / Centreon E2S 1.1-RC2
OS: Ubuntu / Debian / CentOS
Reply With Quote
Reply

Thread Tools
Display Modes

Posting Rules
You may not post new threads
You may not post replies
You may not post attachments
You may not edit your posts

BB code is On
Smilies are On
[IMG] code is On
HTML code is Off

Forum Jump


All times are GMT +2. The time now is 23:15.