Announcement

Collapse
No announcement yet.

Problème avec le fichier nagios.cfg

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Problème avec le fichier nagios.cfg

    Bonjour,
    Je viens d'installer nagios 2.9 avec les plugins et nrpe2.8.1, puis, j'ai installé oreon 1.4.
    Puis sur oreon j'ai créé un utilisateur,post,groupe,service.
    Jusqu'ici je n'avais pas de problème.

    Puis j'ai exporté vers nagios en passant par la configuration-->Nagios-->Exporter

    Code:
    cgi.cfg - déplacement OK
    checkcommands.cfg - déplacement OK
    contactgroups.cfg - déplacement OK
    contacts.cfg - déplacement OK
    dependencies.cfg - déplacement OK
    escalations.cfg - déplacement OK
    hostextinfo.cfg - déplacement OK
    hostgroups.cfg - déplacement OK
    hosts.cfg - déplacement OK
    misccommands.cfg - déplacement OK
    nagios.cfg - déplacement OK
    resource.cfg - déplacement OK
    serviceextinfo.cfg - déplacement OK
    servicegroups.cfg - déplacement OK
    services.cfg - déplacement OK
    timeperiods.cfg - déplacement OK
    
    Running configuration check... FAILED! Reload aborted. Check your Nagios configuration.

    Mon fichier nagios.cfg :
    Code:
    Informations 
    Nom de cette configuration Nagios CFG 1 
    Commentaires pour ce fichier Default Nagios.cfg Generated by Oreon Auto Setup  
    Etat (x)Activé ( )Désactivé 
       
    Log file /var/log/nagios/nagios.log 
    Object Configuration Directory /etc/nagios/ 
    Temp File   
    P1 File   
    Object Cache File   
       
    Status File /var/log/nagios/status.log 
    Aggregated Status Updates Option ( )Oui (x)Non ( )Défaut 
    Aggregated Status Data Update Interval 15 
       
    Nagios User nagios 
    Nagios Group nagios 
       
    Notification Option (x)Oui ( )Non ( )Défaut 
    Service Check Execution Option (x)Oui ( )Non ( )Défaut 
    Passive Service Check Acceptance Option (x)Oui ( )Non ( )Défaut 
    Event Handler Option (x)Oui ( )Non ( )Défaut 
    Host Check Execution Option ( )Oui ( )Non (x)Défaut 
    Passive Host Check Acceptance Option ( )Oui ( )Non (x)Défaut 
       
    Log Rotation Method ( )n  ( )h  (x)d  ( )w  ( )m 
    Log Archive Path /var/log/nagios/archives/ 
       
    External Command Check Option (x)Oui ( )Non ( )Défaut 
    External Command Check Interval 1s 
    External Command File /var/log/nagios/rw/nagios.cmd 
       
    Downtime File /var/log/nagios/downtime.log 
    Comment File /var/log/nagios/comment.log 
    Lock File /var/log/nagios/nagios.lock 
       
    State Retention Option (x)Oui ( )Non ( )Défaut 
    State Retention File /var/log/nagios/status.sav 
    Automatic State Retention Update Interval 60 
    Use Retained Program State Option (x)Oui ( )Non ( )Défaut 
    Use Retained Scheduling Info Option ( )Oui ( )Non (x)Défaut 
       
    Syslog Logging Option ( )Oui (x)Non ( )Défaut 
    Notification Logging Option (x)Oui ( )Non ( )Défaut 
    Service Check Retry Logging Option (x)Oui ( )Non ( )Défaut 
    Host Retry Logging Option (x)Oui ( )Non ( )Défaut 
    Event Handler Logging Option (x)Oui ( )Non ( )Défaut 
    Initial State Logging Option (x)Oui ( )Non ( )Défaut 
    External Command Logging Option (x)Oui ( )Non ( )Défaut 
    Passive Check Logging Option ( )Oui ( )Non (x)Défaut 
       
    Global Host Event Handler  
    Global Service Event Handler  
       
    Inter-Check Sleep Time 1 
    Service Inter-Check Delay Method   
    Maximum Service Check Spread   
    Service Interleave Factor s 
    Maximum Concurrent Service Checks 20 
    Service Repear Frequency 10 
    Host Inter-Check Delay Method   
    Maximum Host Check Spread   
    Timing Interval Length 60 
    Auto-Rescheduling Option ( )Oui ( )Non (x)Défaut 
    Auto-Rescheduling Interval   
    Auto-Rescheduling Window   
       
    Aggressive Host Checking Option (x)Oui ( )Non ( )Défaut 
       
    Flap Detection Option ( )Oui (x)Non ( )Défaut 
    Low Service Flap Threshold 25.0 
    High Service Flap Threshold 50.0 
    Low Host Flap Threshold 25.0 
    High Host Flap Threshold 50.0 
       
    Soft Service Dependencies Option ( )Oui (x)Non ( )Défaut 
       
    Service Check Timeout 60 
    Host Check Timeout 60 
    Event Handler Timeout 60 
    Notification Timeout 60 
    Performance Data Processor Command Timeout 5 
    Obsessive Compulsive Service Processor Timeout 1 
    Obsessive Compulsive Host Processor Timeout   
       
    Obsess Over Services Option ( )Oui (x)Non ( )Défaut 
    Obsessive Compulsive Service Processor Command  
    Obsess Over Hosts Option ( )Oui ( )Non (x)Défaut 
    Obsessive Compulsive Host Processor Command  
       
    Performance Data Processing Option (x)Oui ( )Non ( )Défaut 
    Host Performance Data Processing Command  
    Service Performance Data Processing Command  
    Host Performance Data File   
    Service Performance Data File   
    Host Performance Data File Template  
    Service Performance Data File Template  
    Host Performance Data File Mode ( )a ( )w ( )Défaut 
    Service Performance Data File Mode ( )a ( )w ( )Défaut 
    Host Performance Data File Processing Interval   
    Service Performance Data File Processing Interval   
    Host Performance Data File Processing Command  
    Service Performance Data File Processing Command  
       
    Orphaned Service Check Option ( )Oui (x)Non ( )Défaut 
       
    Service Freshness Checking Option (x)Oui ( )Non ( )Défaut 
    Service Freshness Check Interval   
    Host Freshness Checking Option ( )Oui ( )Non (x)Défaut 
    Host Freshness Check Interval   
       
    Date Format euro 
    Illegal Object Name Characters ~!$%^&*"|'<>?,()= 
    Illegal Macro Output Characters `~$^&"|'<> 
    Regular Expression Matching Option ( )Oui ( )Non (x)Défaut 
    True Regular Expression Matching Option ( )Oui ( )Non (x)Défaut 
       
    Administrator Email Address admin 
    Administrator Pager [email protected] 
      NDO 
    Broker Module
    Après avoir lu la configue, je me suis aperçu que certains de ces fichiers n'existent nul part dans la machine :
    status.log
    nagios.cmd
    downtime.log
    comment.log
    nagios.lock
    status.sav

    Et Je ne sais plus trop quoi faire, si quelqu'un a une idée je suis preneur.
    mon OS= REDHAT EL4.

    Merci a vous.

  • #2
    En lisant la documentation nagios.
    J'ai effectué la commande nagios -v /etc/nagios/nagios.cfg
    J'ai pu voir que lorsque l'on cré un utilisateur dans oreon et qu'on le met dans un groupe il faut retourné dans le configuration de l'utilisateur.


    Cependant un problème persiste toujours lorsque je reload le service :
    Code:
    [[email protected] nagios]# /etc/init.d/nagios reload
    Running configuration check...done
    Stopping nagios: kill: usage: kill [-s sigspec | -n signum | -sigspec] [pid | job]... or kill -l [sigspec]
    done.
    Starting nagios: done.
    [[email protected] nagios]# /etc/init.d/nagios status
    nagios is not running
    Si quelqu'un a une idée , merci.

    Comment


    • #3
      on dirait un probleme de droits d'ecriture,

      en tout cas pour le fichier de status (status.sav) et celui le lock (nagios.lock).

      A mon avis il merdoie à cause de ca car il ne trouve pas le lock donc il fait n'importe quoi.

      Pourais tu voir si en demarrant nagios il reside bien en mémoire une seule fois ?

      Ensuite est ce que tu peux voir si le fichier de lock (nagios.lock) contient bien le meme numero de process que celui residant en mémoire.
      ..()_() .°("who | grep -i blonde | date; cd ~; unzip;")
      =(o_0)=
      *(() () Nicolas Verriest, France

      Comment


      • #4
        Je pense que les droits sont bon, mais regardez par vous même.


        Code:
        [[email protected] ~]# ll /var/log/nagios/status.sav
        -rw-rw----  1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
        [[email protected] ~]# ll /var/log/nagios/status.sav
        -rw-rw----  1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
        [[email protected] ~]# ll /var/log/nagios/nagios.lock
        -rw-r--r--  1 nagios nagios 5 mai 16 08:18 /var/log/nagios/nagios.lock
        [[email protected] ~]# /etc/init.d/nagios start
        Starting nagios: done.
        [[email protected] ~]# /etc/init.d/nagios status
        nagios is not running
        [[email protected] ~]# ps -A | grep nagios
         4456 ?        00:00:00 nagios
        [[email protected] ~]# cat /var/log/nagios/nagios.lock
        4456
        [[email protected] ~]# tail -n 8 /var/log/nagios/nagios.log
        [1179304881] Nagios 2.9 starting... (PID=4910)
        [1179304881] LOG VERSION: 2.0
        [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
        [1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
        [1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
        Sachant que Taille disque est un service créé sous oreon dont voici une partie de la config :
        Code:
        Informations générales 
        Description Taille disque 
        Template de Service
        Utiliser un Template vous dispense des éléments de configuration obligatoires    
          Status du Service 
        Service volatil ( )Oui ( )Non (x)Défaut 
        Période de controle 24x7 
        Commande de check check_disk_space  
        Arguments    
        Nombre maximum d'essais 5 
        Ordonnancement régulier 1 * 60 secondes  
        Ordonnancement non régulier 1 * 60 secondes  
        Activation du gestionnaire d'évènements ( )Oui ( )Non (x)Défaut 
        Commande associée   
        Arguments    
        Controles actifs ( )Oui ( )Non (x)Défaut 
        Controles passifs ( )Oui ( )Non (x)Défaut
        SBSTAGE est un host créé sous oreon aussi.

        Merci.

        Comment


        • #5
          Code:
          [1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
          [1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
          ca resemble à une variable $USER1$ (en général le path des plugins nagios) qui n'est pas bien configurée dans ressources.cfg ou un plugin qui ne peut pas être executé par Nagios, ou encore une commande check_disk_space mal configurée.

          Gaé
          Last edited by gae; 16 May 2007, 11:29.

          Comment


          • #6
            C'est plus cette partie qui m'interroge :
            Code:
            [1179304881] Nagios 2.9 starting... (PID=4910)
            [1179304881] LOG VERSION: 2.0
            [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...


            Voici mon $USER1$=/usr/local/nagios/libexec
            et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

            Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.

            Comment


            • #7
              Originally posted by Krollo View Post
              C'est plus cette partie qui m'interroge :
              Code:
              [1179304881] Nagios 2.9 starting... (PID=4910)
              [1179304881] LOG VERSION: 2.0
              [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
              ->
              [CODE]
              sudo rm /var/log/nagios/nagios.lock
              [CODE]
              puis, vérification si il reste des Nagios qui tournent ...
              Code:
              ps aux | grep 'nagios -d'
              si tu a un ou plusieurs processus de nagios qui tournent :
              pour chaque :
              Code:
              kill (PID)
              ou si il y en a beaucoup /!\ (fait quand même un 'echo sudo kill ... ' pour vérifier avant)
              Code:
              for i in `ps aux | grep 'nagios -d' | awk '{ print $2}'`; do sudo kill "$i"; done
              Originally posted by Krollo View Post
              Voici mon $USER1$=/usr/local/nagios/libexec
              et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

              Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.
              dans la définition de ton service :
              remplace check_nt par check_nt.pl !!! normal qu'il ne le trouve pas !!!
              si ca ne marche toujours pas, essaye un :
              Code:
              check_disk_space=(path_perl)/perl $USER1$/check_nt.pl ...
              mais normalement, il n'y a pas besoin si su as compilé nagios avec l'option --enable-perl (au passage, le --enable-perlcash ou un truc du genre va assez bien avec)

              (./configure --help de nagios pour plus d'info sur les options de compilation !!)

              Gaé

              Comment


              • #8
                Déja, Merci Gaé de me répondre.

                Mais en ce qui concerne.

                Code:
                [1179304881] Nagios 2.9 starting... (PID=4910)
                [1179304881] LOG VERSION: 2.0
                [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
                En changeant dans oreon :
                Lock File : /var/log/nagios.lock
                Par:
                Lock File : /var/run/nagios.pid

                Ca marche, comme vous pouvez le voir dans les log :

                Code:
                [1179477144] Successfully shutdown... (PID=5926)
                [1179477144] Nagios 2.9 starting... (PID=5970)
                [1179477144] LOG VERSION: 2.0
                [1179477144] Finished daemonizing... (New PID=5971)
                [1179477144] INITIAL HOST STATE: SBSTAGE;DOWN;HARD;1;Arguments -l erronés.
                [1179477144] INITIAL SERVICE STATE: SBSTAGE;Taille disque;UNKNOWN;HARD;1;Arguments -l erronés.

                Même si j'ai toujours des problèmes comme vous pouvez le voir au dessus, je vous remerci encore de votre aides.

                Comment


                • #9
                  alors, j'ai été confronté au meme probleme que toi au début, apparament puisque t'utilise un redhat 4, je suppose que ta installé nagios via le YUM.
                  Ce que j'ai fait, j'ai été voir dans le fichier nagios.cfg dans /etc/nagios, (packe j'ai pas l'arborescence standard de nagios : /usr/local/nagios) et j'ai rempli l'interface d'oreon en se basant sur le .cfg de nagios par exemple :

                  Log file /var/log/nagios/nagios.log
                  Object Configuration Directory /etc/nagios/
                  Temp File /var/log/nagios/nagios.tmp
                  P1 File /usr/bin/p1.pl
                  Object Cache File /var/log/nagios/objects.cache

                  j'espere ke je t'ai aidé.
                  Mais moi aussi j'avance pas trop, j'ai un probleme de monitoring, je ne vois ni les hosts ni les services.

                  Comment


                  • #10
                    lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

                    http://forum.oreon-project.org/showthread.php?t=3565

                    http://forums.bfl-solutions.eu/viewtopic.php?t=5880

                    Comment


                    • #11
                      Originally posted by Azarius View Post
                      lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

                      http://forum.oreon-project.org/showthread.php?t=3565

                      http://forums.bfl-solutions.eu/viewtopic.php?t=5880
                      On est tous dans la meme galere, alors ce que j'ai fait, j'ai tout pété, et j'ai réinstallé à la main, j'ai réinstallé nagios 2.9, sa compilation s'est bien passé, il comme j'aurai les chemins standard, aprés je suis passé à l'install de perfparse, mais il a merdé lors dans la compil.
                      voila ce qu'il m'affiche :

                      perfchart_png-perfchart.o(.text+0x3a0b):/root/perfparse-0.106.1/cgi/perfchart.c: 295: undefined reference to `gdImagePng'
                      collect2: ld returned 1 exit status
                      make[2]: *** [perfchart.png] Erreur 1
                      make[2]: Leaving directory `/root/perfparse-0.106.1/cgi'
                      make[1]: *** [all-recursive] Erreur 1
                      make[1]: Leaving directory `/root/perfparse-0.106.1'

                      alors si vous avez des suggestions, je vous serai reconnaissant.
                      Merci

                      Comment


                      • #12
                        il te manque peut etre une lib pour perfparse, tu es sur de les avoir tous installés, parce que moi pour nagios j'ai eu le meme probleme et les libgd et libpng était installés dans /usr/local/lib, je les ai copié et collé dans /usr/lib et sa a compiler tout seul

                        après ce n'est pas sur que ce soit les libgd et libpng , mais sa ce pourai au vu de sa "gdImagePng".

                        bon courage

                        Comment


                        • #13
                          Tu as quelle version d'oreon parce que depuis la 1.4 plus besoin de s'embeter avec une installation fastidieuse de perfparse..
                          Oreon 1.4
                          Nagios 2.9
                          RRDTool 1.2.18

                          Comment

                          Working...
                          X