Announcement

Collapse
No announcement yet.

[REGLE] probleme de notification avec "check_host_alive

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • [REGLE] probleme de notification avec "check_host_alive

    Hello everybody!

    J'ai un souci problèm que je n'arrives pas à résoudre...

    la pluspart des service que j 'utilise t'elle que temperature,dns,check_nt etc... fonctionne sans problèm et la notification fonctionne PARFAITEMENT (EMAIL et SMS )

    MAIS!

    J'ai essayé de voir si le service ping LE SERVICE LE PLUS SIMPLE ... "check_host_alive" est operationelle?!!!?. En faisant un test (débrancher le cable reseau)..
    Le service ce mets en "UNKNOWN" jusqu'ici rien d'anormal! par contre ... J'ai malheureusement ... aucune notification!! Malgré que mon groupe de contact liée a se service est le meme que les autres!!! ainsi que les option d'avertissment... là je ne comprends plus rien!! :-(

    J'ai fait pas mal de test... et rien de tres concluent... j'ai juste remarqué une chose... au niveau de la page nagios "Notifications" il m'indique bien qu'il a envoyé la notification!...

    Mais le service de la machine n'est pas affiché ...voir pour y croir... LOL

    ops:
    Nagios 1.2
    Oreon v1.2.2-RC3

  • #2
    Ton check_host alive ne fonctionne tout simplement pas à mon avis.

    Test en ligne de commande avcec le user nagios
    Intel(R) Xeon(TM) CPU 3.4GHz - MemTotal : 1034476 kB
    Centreon 2.4.1 - Nagios 3.2.1 - Nagios Plugins 1.4.15 - Manubulon Plugins tuné
    Fedora Core 5 - 2.6.20-1.2320

    Comment


    • #3
      Originally posted by DonKiShoot
      Ton check_host alive ne fonctionne tout simplement pas à mon avis.

      Test en ligne de commande avcec le user nagios
      Il fonctionne sans prob! en ligne de commande...

      J'vois vraiment pas où sa peu etre...

      voici les options de mon service

      Host name : NGE0201
      Description : ping
      Is Volatile : NOTHING
      Service Groups :
      Check_command : check_host_alive
      Check_command_arguments :
      Max_check_attempts : 5
      Normal_check_interval : 5
      Retry_check_interval : 2
      Active_checks_enabled : NOTHING
      Passive_checks_enabled : NOTHING
      Check_period : 24x7
      Parallelize_check : NOTHING
      Obsess_over_service : NOTHING
      Check_freshness : NOTHING
      Freshness treshold :
      Event_handler :
      Event_handler_arguments :
      Event_handler enabled : NOTHING
      Low flap treshold :
      High flap treshold :
      Flap_detection_enabled : NOTHING
      Process_perf_data : NOTHING
      Retain_status_information : NOTHING
      Retain_nonstatus_information : NOTHING
      Notification_interval : 60
      Notification_period : 24x7
      Notification_options : w,u,c
      Notification_enabled : YES
      # Contact Groups : CONTACT_TEST
      Stalking_options :
      Nagios 1.2
      Oreon v1.2.2-RC3

      Comment


      • #4
        Je crois que j'ai trouvé.

        Tu es obligé d'associé un service au minimum (selon mon expérience).
        Comme tu ne t'interesse qu'au fait qu'il soit up, un check_fping ou check_ping fera l'affaire :wink:
        Intel(R) Xeon(TM) CPU 3.4GHz - MemTotal : 1034476 kB
        Centreon 2.4.1 - Nagios 3.2.1 - Nagios Plugins 1.4.15 - Manubulon Plugins tuné
        Fedora Core 5 - 2.6.20-1.2320

        Comment


        • #5
          Bonjour,

          Si tu débranches ton cable réseau, tous les services liés à l'host sont "en panne". Ce qui signifie que c'est le(s) contactgroup(s) de l'host qui va(vont) être notifié(s). Le(s) contactgroup(s) de l'host est(sont) le(s) contactgroup(s) qui est(sont) dans le hostgroup où se trouve le host.

          Le contactgroup du service ne sera pas notifié si c'est le host qui tombe.

          Comment


          • #6
            Originally posted by templuche
            Bonjour,
            Si tu débranches ton cable réseau, tous les services liés à l'host sont "en panne"..
            Bon... jusqu'ici j'suis d'accord! il met le problem comme hardware et non software!

            Ce qui signifie que c'est le(s) contactgroup(s) de l'host qui va(vont) être notifié(s). Le(s) contactgroup(s) de l'host est(sont) le(s) contactgroup(s) qui est(sont) dans le hostgroup où se trouve le host.
            ... je suis d'accord! j'ai bien parametré mes contactgroup sur mon hostgroupe... avec en + sur chaque contact j'ai bien sécifié les options suivantes...
            host_notification_options : d,u,r
            host_notification_period : 24x7
            service_notification_options : w,u,c,r
            Le contactgroup du service ne sera pas notifié si c'est le host qui tombe.
            la je ne comprends pas ... Comment remedier si votre machine bug au niveau de la carte réseau et ne réponds plus... ???
            Nagios 1.2
            Oreon v1.2.2-RC3

            Comment


            • #7
              Bonjour,

              j'ai bien parametré mes contactgroup sur mon hostgroupe... avec en + sur chaque contact j'ai bien sécifié les options suivantes...
              Bon, si cela ne marche pas, attache des fichiers de configuration (cache les noms, adresses IP, communauté bien sûr). Mais il n'y a pas de dépendance ou de problème de "unreachable" ou encore de flapping?

              la je ne comprends pas ... Comment remedier si votre machine bug au niveau de la carte réseau et ne réponds plus... ???
              Le host est vue comme en panne dans ce cas. Les notifications pour le host partent mais pas les notifications pour les services. Ceci afin d'éviter que l'on soit spammé de mails par Nagios.

              Comment


              • #8
                ok ...

                bon j'ai Réinstaller un host ...

                voici la config:

                Host "LINUXTEST"
                Name : LINUXTEST
                Alias : testLINUX
                Address : 172.16.0.15
                Parents :
                # Host Groups : GPTEST
                Check_command : check_host_alive
                Max_check_attempts : 5
                Checks_enabled : YES
                Event_handler_enabled : NOTHING
                Event_handler :
                Low_flap_threshold :
                High_flap_threshold :
                Flap_detection_enabled : NOTHING
                Process_perf_data : NOTHING
                Retain_status_information : NOTHING
                Retain_nonstatus_information : NOTHING
                Notification_interval : 60
                Notification_period : 24x7
                Notification_options : d,u,r
                Notifications_enabled : YES
                Stalking_options :
                ensuite le service ping
                Service "ping"
                Host name : LINUXTEST
                Description : ping
                Is Volatile : NOTHING
                Service Groups :
                Check_command : check_host_alive
                Check_command_arguments :
                Max_check_attempts : 2
                Normal_check_interval : 2
                Retry_check_interval : 1
                Active_checks_enabled : NOTHING
                Passive_checks_enabled : NOTHING
                Check_period : 24x7
                Parallelize_check : NOTHING
                Obsess_over_service : NOTHING
                Check_freshness : NOTHING
                Freshness treshold :
                Event_handler :
                Event_handler_arguments :
                Event_handler enabled : NOTHING
                Low flap treshold :
                High flap treshold :
                Flap_detection_enabled : NOTHING
                Process_perf_data : NOTHING
                Retain_status_information : NOTHING
                Retain_nonstatus_information : NOTHING
                Notification_interval : 30
                Notification_period : 24x7
                Notification_options : w,u,c,r
                Notification_enabled : NOTHING
                # Contact Groups : CONTACT_TEST
                Stalking_options :
                voici la config de mon contact.
                Name moi
                Alias remoi
                host_notification_options : d,u,r
                host_notification_period : 24x7
                service_notification_options : w,u,c,r
                service_notification_period : 24x7
                # host_notification_command : host-notify-by-email
                # service_notification_command : notify-by-email
                Email : [email protected]

                voici la config de mon contactgroup
                Contact Group(s) "CONTACT_TEST"
                Name CONTACT_TEST
                Alias groupe_de_test
                Contacts :

                * moi
                Command "check_host_alive"
                Type de Commande Check
                Nom de la commande check_host_alive
                Ligne de commande
                $USER1$/check_ping -H $HOSTADDRESS$ -w 3000.0,80% -c 5000.0,100% -p 1




                Et pourtant si j vais dans la page NAGIOS notif. Il affiche comme quoi il bien envoyé ....

                Host Service Type Time Contact Notification Command Information
                LINUXTEST N/A HOST DOWN 02-08-2005 13:45:32 moi host-notify-by-email /bin/ping -n -U -c 1 172.16.0.15

                Voilà .... pourtant.. la notification de temperature fonctionne pafaitement... je suis démoralisé!!! j trouves pas ou pourais etre le probleme!!! ops: ops: ops: :cry: :cry: :cry: :cry: :cry:
                Nagios 1.2
                Oreon v1.2.2-RC3

                Comment


                • #9
                  que te renvoye la commande : /bin/ping -n -U -c 1 172.16.0.15 ?
                  StatusMap Module - NDO Tools Module - ImportCSV Module - SNMP-UI Module - PDFReports Module
                  Dons Paypal

                  Comment


                  • #10
                    Originally posted by wistof
                    que te renvoye la commande : /bin/ping -n -U -c 1 172.16.0.15 ?
                    donc si la machine est sans cable reseau :

                    [[email protected] var]$ /bin/ping -n -U -c 1 172.16.0.15
                    PING 172.16.0.15 (172.16.0.15) 56(84) bytes of data.
                    From 172.16.20.100 icmp_seq=0 Destination Host Unreachable

                    --- 172.16.0.15 ping statistics ---
                    1 packets transmitted, 0 received, +1 errors, 100% packet loss, time 0ms
                    , pipe 2
                    [[email protected] var]$

                    et avec la carte reseau

                    [[email protected] var]$ /bin/ping -n -U -c 1 172.16.0.15
                    PING 172.16.0.15 (172.16.0.15) 56(84) bytes of data.
                    64 bytes from 172.16.0.15: icmp_seq=0 ttl=64 time=1.11 ms

                    --- 172.16.0.15 ping statistics ---
                    1 packets transmitted, 1 received, 0% packet loss, time 0ms
                    rtt min/avg/max/mdev = 1.119/1.119/1.119/0.000 ms, pipe 2
                    [[email protected] var]$
                    Nagios 1.2
                    Oreon v1.2.2-RC3

                    Comment


                    • #11
                      et si tu lances
                      check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                      logiquement ça pete ?
                      StatusMap Module - NDO Tools Module - ImportCSV Module - SNMP-UI Module - PDFReports Module
                      Dons Paypal

                      Comment


                      • #12
                        Originally posted by wistof
                        et si tu lances
                        check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                        logiquement ça pete ?

                        donc j'ai executé ses 2 commandes avec 5 sec d intervalle .. j ai ressu 2 réponse differentes... malgré que le cable est débranché

                        [[email protected] var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                        CRITICAL - Plugin timed out after 10 seconds

                        [[email protected] var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                        /bin/ping -n -U -c 1 172.16.0.15
                        Error: Could not interpret output from ping command
                        [nagios[email protected] var]$
                        Nagios 1.2
                        Oreon v1.2.2-RC3

                        Comment


                        • #13
                          Originally posted by skywolker
                          [[email protected] var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                          /bin/ping -n -U -c 1 172.16.0.15
                          Error: Could not interpret output from ping command
                          [[email protected] var]$
                          utilise check_fping.

                          check_ping n'arrive pas à parser le
                          rtt min/avg/max/mdev = 1.119/1.119/1.119/0.000 ms, pipe 2
                          il attend des 'float' qui sont de la forme
                          1,119
                          StatusMap Module - NDO Tools Module - ImportCSV Module - SNMP-UI Module - PDFReports Module
                          Dons Paypal

                          Comment


                          • #14
                            Originally posted by DonKiShoot
                            Ton check_host alive ne fonctionne tout simplement pas à mon avis.

                            Test en ligne de commande avcec le user nagios
                            Originally posted by skywolker
                            [[email protected] var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                            /bin/ping -n -U -c 1 172.16.0.15
                            Error: Could not interpret output from ping command
                            Ca m'nrv quand on ne m'écoute pas ! :lol:
                            Intel(R) Xeon(TM) CPU 3.4GHz - MemTotal : 1034476 kB
                            Centreon 2.4.1 - Nagios 3.2.1 - Nagios Plugins 1.4.15 - Manubulon Plugins tuné
                            Fedora Core 5 - 2.6.20-1.2320

                            Comment


                            • #15
                              Originally posted by DonKiShoot
                              Originally posted by DonKiShoot
                              Ton check_host alive ne fonctionne tout simplement pas à mon avis.

                              Test en ligne de commande avcec le user nagios
                              Originally posted by skywolker
                              [[email protected] var]$ /usr/local/nagios/libexec/check_ping -H 172.16.0.15 -w 3000.0,80% -c 5000.0,100% -p 1
                              /bin/ping -n -U -c 1 172.16.0.15
                              Error: Could not interpret output from ping command
                              Ca m'nrv quand on ne m'écoute pas ! :lol:
                              je sais DonKiShoot............. ops: ops: ops: ops:
                              J'ai installé le fping avec la modification sur le visudo : car visiblement il lui faut les droit ROOOOOT! (et oui!)

                              visudo:

                              nagios ALL=NOPASSWD: /usr/local/nagios/libexec/check_fping

                              Et sa marche!!!!!!!!!!!!!!!!

                              MERCI tous l monde!!!

                              donc le check_ping est utilisé pour la qualité du ping et rien d'autre... bon b1... voilà KOI! !! je savais pas...
                              Nagios 1.2
                              Oreon v1.2.2-RC3

                              Comment

                              Working...
                              X