PDA

View Full Version : Problème avec le fichier nagios.cfg


Krollo
15th May 2007, 14:38
Bonjour,
Je viens d'installer nagios 2.9 avec les plugins et nrpe2.8.1, puis, j'ai installé oreon 1.4.
Puis sur oreon j'ai créé un utilisateur,post,groupe,service.
Jusqu'ici je n'avais pas de problème.

Puis j'ai exporté vers nagios en passant par la configuration-->Nagios-->Exporter

cgi.cfg - déplacement OK
checkcommands.cfg - déplacement OK
contactgroups.cfg - déplacement OK
contacts.cfg - déplacement OK
dependencies.cfg - déplacement OK
escalations.cfg - déplacement OK
hostextinfo.cfg - déplacement OK
hostgroups.cfg - déplacement OK
hosts.cfg - déplacement OK
misccommands.cfg - déplacement OK
nagios.cfg - déplacement OK
resource.cfg - déplacement OK
serviceextinfo.cfg - déplacement OK
servicegroups.cfg - déplacement OK
services.cfg - déplacement OK
timeperiods.cfg - déplacement OK

Running configuration check... FAILED! Reload aborted. Check your Nagios configuration.



Mon fichier nagios.cfg :
Informations
Nom de cette configuration Nagios CFG 1
Commentaires pour ce fichier Default Nagios.cfg Generated by Oreon Auto Setup
Etat (x)Activé ( )Désactivé

Log file /var/log/nagios/nagios.log
Object Configuration Directory /etc/nagios/
Temp File
P1 File
Object Cache File

Status File /var/log/nagios/status.log
Aggregated Status Updates Option ( )Oui (x)Non ( )Défaut
Aggregated Status Data Update Interval 15

Nagios User nagios
Nagios Group nagios

Notification Option (x)Oui ( )Non ( )Défaut
Service Check Execution Option (x)Oui ( )Non ( )Défaut
Passive Service Check Acceptance Option (x)Oui ( )Non ( )Défaut
Event Handler Option (x)Oui ( )Non ( )Défaut
Host Check Execution Option ( )Oui ( )Non (x)Défaut
Passive Host Check Acceptance Option ( )Oui ( )Non (x)Défaut

Log Rotation Method ( )n ( )h (x)d ( )w ( )m
Log Archive Path /var/log/nagios/archives/

External Command Check Option (x)Oui ( )Non ( )Défaut
External Command Check Interval 1s
External Command File /var/log/nagios/rw/nagios.cmd

Downtime File /var/log/nagios/downtime.log
Comment File /var/log/nagios/comment.log
Lock File /var/log/nagios/nagios.lock

State Retention Option (x)Oui ( )Non ( )Défaut
State Retention File /var/log/nagios/status.sav
Automatic State Retention Update Interval 60
Use Retained Program State Option (x)Oui ( )Non ( )Défaut
Use Retained Scheduling Info Option ( )Oui ( )Non (x)Défaut

Syslog Logging Option ( )Oui (x)Non ( )Défaut
Notification Logging Option (x)Oui ( )Non ( )Défaut
Service Check Retry Logging Option (x)Oui ( )Non ( )Défaut
Host Retry Logging Option (x)Oui ( )Non ( )Défaut
Event Handler Logging Option (x)Oui ( )Non ( )Défaut
Initial State Logging Option (x)Oui ( )Non ( )Défaut
External Command Logging Option (x)Oui ( )Non ( )Défaut
Passive Check Logging Option ( )Oui ( )Non (x)Défaut

Global Host Event Handler
Global Service Event Handler

Inter-Check Sleep Time 1
Service Inter-Check Delay Method
Maximum Service Check Spread
Service Interleave Factor s
Maximum Concurrent Service Checks 20
Service Repear Frequency 10
Host Inter-Check Delay Method
Maximum Host Check Spread
Timing Interval Length 60
Auto-Rescheduling Option ( )Oui ( )Non (x)Défaut
Auto-Rescheduling Interval
Auto-Rescheduling Window

Aggressive Host Checking Option (x)Oui ( )Non ( )Défaut

Flap Detection Option ( )Oui (x)Non ( )Défaut
Low Service Flap Threshold 25.0
High Service Flap Threshold 50.0
Low Host Flap Threshold 25.0
High Host Flap Threshold 50.0

Soft Service Dependencies Option ( )Oui (x)Non ( )Défaut

Service Check Timeout 60
Host Check Timeout 60
Event Handler Timeout 60
Notification Timeout 60
Performance Data Processor Command Timeout 5
Obsessive Compulsive Service Processor Timeout 1
Obsessive Compulsive Host Processor Timeout

Obsess Over Services Option ( )Oui (x)Non ( )Défaut
Obsessive Compulsive Service Processor Command
Obsess Over Hosts Option ( )Oui ( )Non (x)Défaut
Obsessive Compulsive Host Processor Command

Performance Data Processing Option (x)Oui ( )Non ( )Défaut
Host Performance Data Processing Command
Service Performance Data Processing Command
Host Performance Data File
Service Performance Data File
Host Performance Data File Template
Service Performance Data File Template
Host Performance Data File Mode ( )a ( )w ( )Défaut
Service Performance Data File Mode ( )a ( )w ( )Défaut
Host Performance Data File Processing Interval
Service Performance Data File Processing Interval
Host Performance Data File Processing Command
Service Performance Data File Processing Command

Orphaned Service Check Option ( )Oui (x)Non ( )Défaut

Service Freshness Checking Option (x)Oui ( )Non ( )Défaut
Service Freshness Check Interval
Host Freshness Checking Option ( )Oui ( )Non (x)Défaut
Host Freshness Check Interval

Date Format euro
Illegal Object Name Characters ~!$%^&*"|'<>?,()=
Illegal Macro Output Characters `~$^&"|'<>
Regular Expression Matching Option ( )Oui ( )Non (x)Défaut
True Regular Expression Matching Option ( )Oui ( )Non (x)Défaut

Administrator Email Address admin
Administrator Pager admin@localhost
NDO
Broker Module


Après avoir lu la configue, je me suis aperçu que certains de ces fichiers n'existent nul part dans la machine :
status.log
nagios.cmd
downtime.log
comment.log
nagios.lock
status.sav

Et Je ne sais plus trop quoi faire, si quelqu'un a une idée je suis preneur.
mon OS= REDHAT EL4.

Merci a vous.

Krollo
15th May 2007, 15:37
En lisant la documentation nagios.
J'ai effectué la commande nagios -v /etc/nagios/nagios.cfg
J'ai pu voir que lorsque l'on cré un utilisateur dans oreon et qu'on le met dans un groupe il faut retourné dans le configuration de l'utilisateur.


Cependant un problème persiste toujours lorsque je reload le service :
[root@xx nagios]# /etc/init.d/nagios reload
Running configuration check...done
Stopping nagios: kill: usage: kill [-s sigspec | -n signum | -sigspec] [pid | job]... or kill -l [sigspec]
done.
Starting nagios: done.
[root@xx nagios]# /etc/init.d/nagios status
nagios is not running


Si quelqu'un a une idée :), merci.

NoS
15th May 2007, 16:05
on dirait un probleme de droits d'ecriture,

en tout cas pour le fichier de status (status.sav) et celui le lock (nagios.lock).

A mon avis il merdoie à cause de ca car il ne trouve pas le lock donc il fait n'importe quoi.

Pourais tu voir si en demarrant nagios il reside bien en mémoire une seule fois ?

Ensuite est ce que tu peux voir si le fichier de lock (nagios.lock) contient bien le meme numero de process que celui residant en mémoire.

Krollo
16th May 2007, 11:57
Je pense que les droits sont bon, mais regardez par vous même.


[root@localhost ~]# ll /var/log/nagios/status.sav
-rw-rw---- 1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
[root@localhost ~]# ll /var/log/nagios/status.sav
-rw-rw---- 1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
[root@localhost ~]# ll /var/log/nagios/nagios.lock
-rw-r--r-- 1 nagios nagios 5 mai 16 08:18 /var/log/nagios/nagios.lock
[root@localhost ~]# /etc/init.d/nagios start
Starting nagios: done.
[root@localhost ~]# /etc/init.d/nagios status
nagios is not running
[root@localhost ~]# ps -A | grep nagios
4456 ? 00:00:00 nagios
[root@localhost ~]# cat /var/log/nagios/nagios.lock
4456
[root@localhost ~]# tail -n 8 /var/log/nagios/nagios.log
[1179304881] Nagios 2.9 starting... (PID=4910)
[1179304881] LOG VERSION: 2.0
[1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456. Bailing out...
[1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
[1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.


Sachant que Taille disque est un service créé sous oreon dont voici une partie de la config :
Informations générales
Description Taille disque
Template de Service
Utiliser un Template vous dispense des éléments de configuration obligatoires
Status du Service
Service volatil ( )Oui ( )Non (x)Défaut
Période de controle 24x7
Commande de check check_disk_space
Arguments
Nombre maximum d'essais 5
Ordonnancement régulier 1 * 60 secondes
Ordonnancement non régulier 1 * 60 secondes
Activation du gestionnaire d'évènements ( )Oui ( )Non (x)Défaut
Commande associée
Arguments
Controles actifs ( )Oui ( )Non (x)Défaut
Controles passifs ( )Oui ( )Non (x)Défaut


SBSTAGE est un host créé sous oreon aussi.

Merci.

gae
16th May 2007, 12:26
[1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
[1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.


ca resemble à une variable $USER1$ (en général le path des plugins nagios) qui n'est pas bien configurée dans ressources.cfg ou un plugin qui ne peut pas être executé par Nagios, ou encore une commande check_disk_space mal configurée.

Gaé

Krollo
16th May 2007, 12:57
C'est plus cette partie qui m'interroge :
[1179304881] Nagios 2.9 starting... (PID=4910)
[1179304881] LOG VERSION: 2.0
[1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456. Bailing out...




Voici mon $USER1$=/usr/local/nagios/libexec
et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.

gae
16th May 2007, 16:20
C'est plus cette partie qui m'interroge :
[1179304881] Nagios 2.9 starting... (PID=4910)
[1179304881] LOG VERSION: 2.0
[1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456. Bailing out...



->

sudo rm /var/log/nagios/nagios.lock
[CODE]
puis, vérification si il reste des Nagios qui tournent ...
[CODE]
ps aux | grep 'nagios -d'

si tu a un ou plusieurs processus de nagios qui tournent :
pour chaque :

kill (PID)

ou si il y en a beaucoup /!\ (fait quand même un 'echo sudo kill ... ' pour vérifier avant)

for i in `ps aux | grep 'nagios -d' | awk '{ print $2}'`; do sudo kill "$i"; done



Voici mon $USER1$=/usr/local/nagios/libexec
et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.


dans la définition de ton service :
remplace check_nt par check_nt.pl !!! normal qu'il ne le trouve pas !!!
si ca ne marche toujours pas, essaye un :

check_disk_space=(path_perl)/perl $USER1$/check_nt.pl ...

mais normalement, il n'y a pas besoin si su as compilé nagios avec l'option --enable-perl (au passage, le --enable-perlcash ou un truc du genre va assez bien avec)

(./configure --help de nagios pour plus d'info sur les options de compilation !!)

Gaé

Krollo
18th May 2007, 11:32
Déja, Merci Gaé de me répondre.

Mais en ce qui concerne.

[1179304881] Nagios 2.9 starting... (PID=4910)
[1179304881] LOG VERSION: 2.0
[1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456. Bailing out...

En changeant dans oreon :
Lock File : /var/log/nagios.lock
Par:
Lock File : /var/run/nagios.pid

Ca marche, comme vous pouvez le voir dans les log :

[1179477144] Successfully shutdown... (PID=5926)
[1179477144] Nagios 2.9 starting... (PID=5970)
[1179477144] LOG VERSION: 2.0
[1179477144] Finished daemonizing... (New PID=5971)
[1179477144] INITIAL HOST STATE: SBSTAGE;DOWN;HARD;1;Arguments -l erronés.
[1179477144] INITIAL SERVICE STATE: SBSTAGE;Taille disque;UNKNOWN;HARD;1;Arguments -l erronés.


Même si j'ai toujours des problèmes comme vous pouvez le voir au dessus, je vous remerci encore de votre aides.

anouar
29th May 2007, 15:10
alors, j'ai été confronté au meme probleme que toi au début, apparament puisque t'utilise un redhat 4, je suppose que ta installé nagios via le YUM.
Ce que j'ai fait, j'ai été voir dans le fichier nagios.cfg dans /etc/nagios, (packe j'ai pas l'arborescence standard de nagios : /usr/local/nagios) et j'ai rempli l'interface d'oreon en se basant sur le .cfg de nagios par exemple :

Log file /var/log/nagios/nagios.log
Object Configuration Directory /etc/nagios/
Temp File /var/log/nagios/nagios.tmp
P1 File /usr/bin/p1.pl
Object Cache File /var/log/nagios/objects.cache

j'espere ke je t'ai aidé.
Mais moi aussi j'avance pas trop, j'ai un probleme de monitoring, je ne vois ni les hosts ni les services.

Azarius
29th May 2007, 15:40
lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

http://forum.oreon-project.org/showthread.php?t=3565

http://forums.bfl-solutions.eu/viewtopic.php?t=5880

anouar
30th May 2007, 14:30
lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

http://forum.oreon-project.org/showthread.php?t=3565

http://forums.bfl-solutions.eu/viewtopic.php?t=5880
On est tous dans la meme galere, alors ce que j'ai fait, j'ai tout pété, et j'ai réinstallé à la main, j'ai réinstallé nagios 2.9, sa compilation s'est bien passé, il comme j'aurai les chemins standard, aprés je suis passé à l'install de perfparse, mais il a merdé lors dans la compil.
voila ce qu'il m'affiche :

perfchart_png-perfchart.o(.text+0x3a0b):/root/perfparse-0.106.1/cgi/perfchart.c: 295: undefined reference to `gdImagePng'
collect2: ld returned 1 exit status
make[2]: *** [perfchart.png] Erreur 1
make[2]: Leaving directory `/root/perfparse-0.106.1/cgi'
make[1]: *** [all-recursive] Erreur 1
make[1]: Leaving directory `/root/perfparse-0.106.1'

alors si vous avez des suggestions, je vous serai reconnaissant.
Merci:(

Azarius
30th May 2007, 15:08
il te manque peut etre une lib pour perfparse, tu es sur de les avoir tous installés, parce que moi pour nagios j'ai eu le meme probleme et les libgd et libpng était installés dans /usr/local/lib, je les ai copié et collé dans /usr/lib et sa a compiler tout seul

après ce n'est pas sur que ce soit les libgd et libpng , mais sa ce pourai au vu de sa "gdImagePng".

bon courage

clementthersiquel
30th May 2007, 15:45
Tu as quelle version d'oreon parce que depuis la 1.4 plus besoin de s'embeter avec une installation fastidieuse de perfparse..