PDA

View Full Version : [REGLE] probleme de notification avec "check_host_alive


skywolker
29th July 2005, 18:14
Hello everybody!

J'ai un souci problèm que je n'arrives pas à résoudre...

la pluspart des service que j 'utilise t'elle que temperature,dns,check_nt etc... fonctionne sans problèm et la notification fonctionne PARFAITEMENT (EMAIL et SMS )

MAIS!

J'ai essayé de voir si le service ping LE SERVICE LE PLUS SIMPLE ... "check_host_alive" est operationelle?!!!?. En faisant un test (débrancher le cable reseau)..
Le service ce mets en "UNKNOWN" jusqu'ici rien d'anormal! par contre ... J'ai malheureusement ... aucune notification!! Malgré que mon groupe de contact liée a se service est le meme que les autres!!! ainsi que les option d'avertissment... là je ne comprends plus rien!! :-(

J'ai fait pas mal de test... et rien de tres concluent... j'ai juste remarqué une chose... au niveau de la page nagios "Notifications" il m'indique bien qu'il a envoyé la notification!...

Mais le service de la machine n'est pas affiché ...voir pour y croir... LOL

http://img140.imageshack.us/img140/1806/oreon1jh.th.jpg (http://img140.imageshack.us/my.php?image=oreon1jh.jpg) :oops:

DonKiShoot
30th July 2005, 10:55
Ton check_host alive ne fonctionne tout simplement pas à mon avis.

Test en ligne de commande avcec le user nagios ;)

skywolker
2nd August 2005, 12:12
Ton check_host alive ne fonctionne tout simplement pas à mon avis.

Test en ligne de commande avcec le user nagios ;)

Il fonctionne sans prob! en ligne de commande...

J'vois vraiment pas où sa peu etre...

voici les options de mon service

Host name : NGE0201
Description : ping
Is Volatile : NOTHING
Service Groups :
Check_command : check_host_alive
Check_command_arguments :
Max_check_attempts : 5
Normal_check_interval : 5
Retry_check_interval : 2
Active_checks_enabled : NOTHING
Passive_checks_enabled : NOTHING
Check_period : 24x7
Parallelize_check : NOTHING
Obsess_over_service : NOTHING
Check_freshness : NOTHING
Freshness treshold :
Event_handler :
Event_handler_arguments :
Event_handler enabled : NOTHING
Low flap treshold :
High flap treshold :
Flap_detection_enabled : NOTHING
Process_perf_data : NOTHING
Retain_status_information : NOTHING
Retain_nonstatus_information : NOTHING
Notification_interval : 60
Notification_period : 24x7
Notification_options : w,u,c
Notification_enabled : YES
# Contact Groups : CONTACT_TEST
Stalking_options :

DonKiShoot
2nd August 2005, 12:30
Je crois que j'ai trouvé.

Tu es obligé d'associé un service au minimum (selon mon expérience).
Comme tu ne t'interesse qu'au fait qu'il soit up, un check_fping ou check_ping fera l'affaire :wink:

templuche
2nd August 2005, 12:34
Bonjour,

Si tu débranches ton cable réseau, tous les services liés à l'host sont "en panne". Ce qui signifie que c'est le(s) contactgroup(s) de l'host qui va(vont) être notifié(s). Le(s) contactgroup(s) de l'host est(sont) le(s) contactgroup(s) qui est(sont) dans le hostgroup où se trouve le host.

Le contactgroup du service ne sera pas notifié si c'est le host qui tombe.

skywolker
2nd August 2005, 13:14
Bonjour,
Si tu débranches ton cable réseau, tous les services liés à l'host sont "en panne"..

Bon... jusqu'ici j'suis d'accord! il met le problem comme hardware et non software!


Ce qui signifie que c'est le(s) contactgroup(s) de l'host qui va(vont) être notifié(s). Le(s) contactgroup(s) de l'host est(sont) le(s) contactgroup(s) qui est(sont) dans le hostgroup où se trouve le host.

... je suis d'accord! j'ai bien parametré mes contactgroup sur mon hostgroupe... avec en + sur chaque contact j'ai bien sécifié les options suivantes...
host_notification_options : d,u,r
host_notification_period : 24x7
service_notification_options : w,u,c,r

Le contactgroup du service ne sera pas notifié si c'est le host qui tombe.

la je ne comprends pas ... Comment remedier si votre machine bug au niveau de la carte réseau et ne réponds plus... ???

templuche
2nd August 2005, 14:11
Bonjour,

j'ai bien parametré mes contactgroup sur mon hostgroupe... avec en + sur chaque contact j'ai bien sécifié les options suivantes...
Bon, si cela ne marche pas, attache des fichiers de configuration (cache les noms, adresses IP, communauté bien sûr). Mais il n'y a pas de dépendance ou de problème de "unreachable" ou encore de flapping?

la je ne comprends pas ... Comment remedier si votre machine bug au niveau de la carte réseau et ne réponds plus... ???
Le host est vue comme en panne dans ce cas. Les notifications pour le host partent mais pas les notifications pour les services. Ceci afin d'éviter que l'on soit spammé de mails par Nagios.

skywolker
2nd August 2005, 14:51
ok ...

bon j'ai Réinstaller un host ...

voici la config:


Host "LINUXTEST"
Name : LINUXTEST
Alias : testLINUX
Address : 172.16.0.15
Parents :
# Host Groups : GPTEST
Check_command : check_host_alive
Max_check_attempts : 5
Checks_enabled : YES
Event_handler_enabled : NOTHING
Event_handler :
Low_flap_threshold :
High_flap_threshold :
Flap_detection_enabled : NOTHING
Process_perf_data : NOTHING
Retain_status_information : NOTHING
Retain_nonstatus_information : NOTHING
Notification_interval : 60
Notification_period : 24x7
Notification_options : d,u,r
Notifications_enabled : YES
Stalking_options :


ensuite le service ping

Service "ping"
Host name : LINUXTEST
Description : ping
Is Volatile : NOTHING
Service Groups :
Check_command : check_host_alive
Check_command_arguments :
Max_check_attempts : 2
Normal_check_interval : 2
Retry_check_interval : 1
Active_checks_enabled : NOTHING
Passive_checks_enabled : NOTHING
Check_period : 24x7
Parallelize_check : NOTHING
Obsess_over_service : NOTHING
Check_freshness : NOTHING
Freshness treshold :
Event_handler :
Event_handler_arguments :
Event_handler enabled : NOTHING
Low flap treshold :
High flap treshold :
Flap_detection_enabled : NOTHING
Process_perf_data : NOTHING
Retain_status_information : NOTHING
Retain_nonstatus_information : NOTHING
Notification_interval : 30
Notification_period : 24x7
Notification_options : w,u,c,r
Notification_enabled : NOTHING
# Contact Groups : CONTACT_TEST
Stalking_options :


voici la config de mon contact.

Name moi
Alias remoi
host_notification_options : d,u,r
host_notification_period : 24x7
service_notification_options : w,u,c,r
service_notification_period : 24x7
# host_notification_command : host-notify-by-email
# service_notification_command : notify-by-email
Email : moi@domaine



voici la config de mon contactgroup

Contact Group(s) "CONTACT_TEST"
Name CONTACT_TEST
Alias groupe_de_test
Contacts :

* moi


Command "check_host_alive"
Type de Commande Check
Nom de la commande check_host_alive
Ligne de commande
$USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 1

http://img137.imageshack.us/img137/3236/oreroer4hi.th.jpg (http://img137.imageshack.us/my.php?image=oreroer4hi.jpg)


Et pourtant si j vais dans la page NAGIOS notif. Il affiche comme quoi il bien envoyé ....

Host Service Type Time Contact Notification Command Information
LINUXTEST N/A HOST DOWN 02-08-2005 13:45:32 moi host-notify-by-email /bin/ping -n -U -c 1 172.16.0.15

Voilà .... pourtant.. la notification de temperature fonctionne pafaitement... je suis démoralisé!!! j trouves pas ou pourais etre le probleme!!! :oops: :oops: :oops: :cry: :cry: :cry: :cry: :cry:

wistof
2nd August 2005, 15:11
que te renvoye la commande : /bin/ping -n -U -c 1 172.16.0.15 ?

skywolker
2nd August 2005, 15:27
que te renvoye la commande : /bin/ping -n -U -c 1 172.16.0.15 ?

donc si la machine est sans cable reseau :

[nagios@nagios var]$ /bin/ping -n -U -c 1 172.16.0.15
PING 172.16.0.15 (172.16.0.15) 56(84) bytes of data.
From 172.16.20.100 icmp_seq=0 Destination Host Unreachable

--- 172.16.0.15 ping statistics ---
1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
, pipe 2
[nagios@nagios var]$

et avec la carte reseau

[nagios@nagios var]$ /bin/ping -n -U -c 1 172.16.0.15
PING 172.16.0.15 (172.16.0.15) 56(84) bytes of data.
64 bytes from 172.16.0.15: icmp_seq=0 ttl=64 time=1.11 ms

--- 172.16.0.15 ping statistics ---
1 packets transmitted, 1 received, 0% packet loss, time 0ms
rtt min/avg/max/mdev = 1.119/1.119/1.119/0.000 ms, pipe 2
[nagios@nagios var]$

wistof
2nd August 2005, 15:30
et si tu lances check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1

logiquement ça pete ?

skywolker
2nd August 2005, 15:33
et si tu lances check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1

logiquement ça pete ?


donc j'ai executé ses 2 commandes avec 5 sec d intervalle .. j ai ressu 2 réponse differentes... malgré que le cable est débranché

[nagios@nagios var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
CRITICAL - Plugin timed out after 10 seconds

[nagios@nagios var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
/bin/ping -n -U -c 1 172.16.0.15
Error: Could not interpret output from ping command
[nagios@nagios var]$

wistof
2nd August 2005, 16:02
[nagios@nagios var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
/bin/ping -n -U -c 1 172.16.0.15
Error: Could not interpret output from ping command
[nagios@nagios var]$
utilise check_fping.

check_ping n'arrive pas à parser le rtt min/avg/max/mdev = 1.119/1.119/1.119/0.000 ms, pipe 2

il attend des 'float' qui sont de la forme 1,119

DonKiShoot
2nd August 2005, 16:08
Ton check_host alive ne fonctionne tout simplement pas à mon avis.

Test en ligne de commande avcec le user nagios ;)

[nagios@nagios var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
/bin/ping -n -U -c 1 172.16.0.15
Error: Could not interpret output from ping command

Ca m'nrv quand on ne m'écoute pas ! :lol:

skywolker
2nd August 2005, 17:30
Ton check_host alive ne fonctionne tout simplement pas à mon avis.

Test en ligne de commande avcec le user nagios ;)

[nagios@nagios var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
/bin/ping -n -U -c 1 172.16.0.15
Error: Could not interpret output from ping command

Ca m'nrv quand on ne m'écoute pas ! :lol:

je sais DonKiShoot............. :oops: :oops: :oops: :oops:
J'ai installé le fping avec la modification sur le visudo : car visiblement il lui faut les droit ROOOOOT! (et oui!)

visudo:

nagios ALL=NOPASSWD: /usr/local/nagios/libexec/check_fping

Et sa marche!!!!!!!!!!!!!!!!

MERCI tous l monde!!!

donc le check_ping est utilisé pour la qualité du ping et rien d'autre... bon b1... voilà KOI! !! je savais pas...