Announcement

Collapse
No announcement yet.

Problème avec le fichier nagios.cfg

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Problème avec le fichier nagios.cfg

    Bonjour,
    Je viens d'installer nagios 2.9 avec les plugins et nrpe2.8.1, puis, j'ai installé oreon 1.4.
    Puis sur oreon j'ai créé un utilisateur,post,groupe,service.
    Jusqu'ici je n'avais pas de problème.

    Puis j'ai exporté vers nagios en passant par la configuration-->Nagios-->Exporter

    Code:
    cgi.cfg - déplacement OK
    checkcommands.cfg - déplacement OK
    contactgroups.cfg - déplacement OK
    contacts.cfg - déplacement OK
    dependencies.cfg - déplacement OK
    escalations.cfg - déplacement OK
    hostextinfo.cfg - déplacement OK
    hostgroups.cfg - déplacement OK
    hosts.cfg - déplacement OK
    misccommands.cfg - déplacement OK
    nagios.cfg - déplacement OK
    resource.cfg - déplacement OK
    serviceextinfo.cfg - déplacement OK
    servicegroups.cfg - déplacement OK
    services.cfg - déplacement OK
    timeperiods.cfg - déplacement OK
    
    Running configuration check... FAILED! Reload aborted. Check your Nagios configuration.

    Mon fichier nagios.cfg :
    Code:
    Informations 
    Nom de cette configuration Nagios CFG 1 
    Commentaires pour ce fichier Default Nagios.cfg Generated by Oreon Auto Setup  
    Etat [B](x)Activé ( )Désactivé [/B]
       
    Log file /var/log/nagios/nagios.log 
    Object Configuration Directory[B] /etc/nagios/[/B] 
    Temp File   
    P1 File   
    Object Cache File   
       
    Status File [B]/var/log/nagios/status.log [/B]
    Aggregated Status Updates Option [I]( )Oui (x)Non ( )Défaut[/I] 
    Aggregated Status Data Update Interval [I]15 [/I]
       
    Nagios User [B]nagios[/B] 
    Nagios Group [B]nagios[/B] 
       
    Notification Option [I](x)Oui ( )Non ( )Défaut [/I]
    Service Check Execution Option [I](x)Oui ( )Non ( )Défaut[/I] 
    Passive Service Check Acceptance Option[I] (x)Oui ( )Non ( )Défaut [/I]
    Event Handler Option [I](x)Oui ( )Non ( )Défaut [/I]
    Host Check Execution Option [I]( )Oui ( )Non (x)Défaut[/I] 
    Passive Host Check Acceptance Option [I]( )Oui ( )Non (x)Défaut[/I] 
       
    Log Rotation Method [I]( )n  ( )h  (x)d  ( )w  ( )m [/I]
    Log Archive Path [B]/var/log/nagios/archives/ [/B]
       
    External Command Check Option [I](x)Oui ( )Non ( )Défaut [/I]
    External Command Check Interval [I]1s [/I]
    External Command File [B]/var/log/nagios/rw/nagios.cmd [/B]
       
    Downtime File [B]/var/log/nagios/downtime.log [/B]
    Comment File [B]/var/log/nagios/comment.log [/B]
    Lock File [B]/var/log/nagios/nagios.lock [/B]
       
    State Retention Option [I](x)Oui ( )Non ( )Défaut [/I]
    State Retention File [I]/var/log/nagios/status.sav [/I]
    Automatic State Retention Update Interval [I]60 [/I]
    Use Retained Program State Option [I](x)Oui ( )Non ( )Défaut [/I]
    Use Retained Scheduling Info Option[I] ( )Oui ( )Non (x)Défaut [/I]
       
    Syslog Logging Option[I] ( )Oui (x)Non ( )Défaut [/I]
    Notification Logging Option [I](x)Oui ( )Non ( )Défaut [/I]
    Service Check Retry Logging Option ([I]x)Oui ( )Non ( )Défaut[/I] 
    Host Retry Logging Option [I](x)Oui ( )Non ( )Défaut [/I]
    Event Handler Logging Option [I](x)Oui ( )Non ( )Défaut [/I]
    Initial State Logging Option [I](x)Oui ( )Non ( )Défaut [/I]
    External Command Logging Option [I](x)Oui ( )Non ( )Défaut[/I] 
    Passive Check Logging Option [I]( )Oui ( )Non (x)Défaut [/I]
       
    Global Host Event Handler  
    Global Service Event Handler  
       
    Inter-Check Sleep Time [I]1 [/I]
    Service Inter-Check Delay Method   
    Maximum Service Check Spread   
    Service Interleave Factor [I]s [/I]
    Maximum Concurrent Service Checks [I]20 [/I]
    Service Repear Frequency [I]10 [/I]
    Host Inter-Check Delay Method   
    Maximum Host Check Spread   
    Timing Interval Length [I]60 [/I]
    Auto-Rescheduling Option [I]( )Oui ( )Non (x)Défaut [/I]
    Auto-Rescheduling Interval   
    Auto-Rescheduling Window   
       
    Aggressive Host Checking Option [I](x)Oui ( )Non ( )Défaut [/I]
       
    Flap Detection Option [I]( )Oui (x)Non ( )Défaut [/I]
    Low Service Flap Threshold [I]25.0[/I] 
    High Service Flap Threshold [I]50.0 [/I]
    Low Host Flap Threshold [I]25.0[/I] 
    High Host Flap Threshold [I]50.0[/I] 
       
    Soft Service Dependencies Option [I]( )Oui (x)Non ( )Défaut[/I] 
       
    Service Check Timeout [I]60[/I] 
    Host Check Timeout [I]60[/I] 
    Event Handler Timeout [I]60[/I] 
    Notification Timeout [I]60[/I] 
    Performance Data Processor Command Timeout[I] 5[/I] 
    Obsessive Compulsive Service Processor Timeout [I]1[/I] 
    Obsessive Compulsive Host Processor Timeout   
       
    Obsess Over Services Option [I]( )Oui (x)Non ( )Défaut[/I] 
    Obsessive Compulsive Service Processor Command  
    Obsess Over Hosts Option [I]( )Oui ( )Non (x)Défaut [/I]
    Obsessive Compulsive Host Processor Command  
       
    Performance Data Processing Option [I](x)Oui ( )Non ( )Défaut[/I] 
    Host Performance Data Processing Command  
    Service Performance Data Processing Command  
    Host Performance Data File   
    Service Performance Data File   
    Host Performance Data File Template  
    Service Performance Data File Template  
    Host Performance Data File Mode [I]( )a ( )w ( )Défaut [/I]
    Service Performance Data File Mode[I] ( )a ( )w ( )Défaut [/I]
    Host Performance Data File Processing Interval   
    Service Performance Data File Processing Interval   
    Host Performance Data File Processing Command  
    Service Performance Data File Processing Command  
       
    Orphaned Service Check Option [I]( )Oui (x)Non ( )Défaut [/I]
       
    Service Freshness Checking Option [I](x)Oui ( )Non ( )Défaut [/I]
    Service Freshness Check Interval   
    Host Freshness Checking Option [I]( )Oui ( )Non (x)Défaut[/I] 
    Host Freshness Check Interval   
       
    Date Format euro 
    Illegal Object Name Characters [I]~!$%^&*"|'<>?,()= [/I]
    Illegal Macro Output Characters [I]`~$^&"|'<> [/I]
    Regular Expression Matching Option [I]( )Oui ( )Non (x)Défaut[/I] 
    True Regular Expression Matching Option [I]( )Oui ( )Non (x)Défaut[/I] 
       
    Administrator Email Address [I]admin [/I]
    Administrator Pager [I][email protected] [/I]
      NDO 
    Broker Module
    Après avoir lu la configue, je me suis aperçu que certains de ces fichiers n'existent nul part dans la machine :
    status.log
    nagios.cmd
    downtime.log
    comment.log
    nagios.lock
    status.sav

    Et Je ne sais plus trop quoi faire, si quelqu'un a une idée je suis preneur.
    mon OS= REDHAT EL4.

    Merci a vous.

  • #2
    En lisant la documentation nagios.
    J'ai effectué la commande nagios -v /etc/nagios/nagios.cfg
    J'ai pu voir que lorsque l'on cré un utilisateur dans oreon et qu'on le met dans un groupe il faut retourné dans le configuration de l'utilisateur.


    Cependant un problème persiste toujours lorsque je reload le service :
    Code:
    [[email protected] nagios]# /etc/init.d/nagios reload
    Running configuration check...done
    Stopping nagios: kill: usage: kill [-s sigspec | -n signum | -sigspec] [pid | job]... or kill -l [sigspec]
    done.
    Starting nagios: done.
    [[email protected] nagios]# /etc/init.d/nagios status
    nagios is not running
    Si quelqu'un a une idée , merci.

    Comment


    • #3
      on dirait un probleme de droits d'ecriture,

      en tout cas pour le fichier de status (status.sav) et celui le lock (nagios.lock).

      A mon avis il merdoie à cause de ca car il ne trouve pas le lock donc il fait n'importe quoi.

      Pourais tu voir si en demarrant nagios il reside bien en mémoire une seule fois ?

      Ensuite est ce que tu peux voir si le fichier de lock (nagios.lock) contient bien le meme numero de process que celui residant en mémoire.
      ..()_() .°("who | grep -i blonde | date; cd ~; unzip;")
      =(o_0)=
      *(() () Nicolas Verriest, France

      Comment


      • #4
        Je pense que les droits sont bon, mais regardez par vous même.


        Code:
        [B][[email protected] ~]# ll /var/log/nagios/status.sav[/B]
        -rw-rw----  1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
        [B][[email protected] ~]# ll /var/log/nagios/status.sav[/B]
        -rw-rw----  1 nagios nagios 2850 mai 16 08:18 /var/log/nagios/status.sav
        [B][[email protected] ~]# ll /var/log/nagios/nagios.lock[/B]
        -rw-r--r--  1 nagios nagios 5 mai 16 08:18 /var/log/nagios/nagios.lock
        [B][[email protected] ~]# /etc/init.d/nagios start[/B]
        Starting nagios: done.
        [B][[email protected] ~]# /etc/init.d/nagios status[/B]
        nagios is not running
        [B][[email protected] ~]# ps -A | grep nagios[/B]
         4456 ?        00:00:00 nagios
        [B][[email protected] ~]# cat /var/log/nagios/nagios.lock[/B]
        4456
        [B][[email protected] ~]# tail -n 8 /var/log/nagios/nagios.log[/B]
        [1179304881] Nagios 2.9 starting... (PID=4910)
        [1179304881] LOG VERSION: 2.0
        [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
        [1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
        [1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
        Sachant que Taille disque est un service créé sous oreon dont voici une partie de la config :
        Code:
        Informations générales 
        Description Taille disque 
        Template de Service
        Utiliser un Template vous dispense des éléments de configuration obligatoires    
          Status du Service 
        Service volatil ( )Oui ( )Non (x)Défaut 
        Période de controle 24x7 
        Commande de check [B]check_disk_space[/B]  
        Arguments    
        Nombre maximum d'essais 5 
        Ordonnancement régulier 1 * 60 secondes  
        Ordonnancement non régulier 1 * 60 secondes  
        Activation du gestionnaire d'évènements ( )Oui ( )Non (x)Défaut 
        Commande associée   
        Arguments    
        Controles actifs ( )Oui ( )Non (x)Défaut 
        Controles passifs ( )Oui ( )Non (x)Défaut
        SBSTAGE est un host créé sous oreon aussi.

        Merci.

        Comment


        • #5
          Code:
          [1179304886] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
          [1179304946] Warning: Return code of 127 for check of service 'Taille disque' on host 'SBSTAGE' was out of bounds. Make sure the plugin you're trying to run actually exists.
          ca resemble à une variable $USER1$ (en général le path des plugins nagios) qui n'est pas bien configurée dans ressources.cfg ou un plugin qui ne peut pas être executé par Nagios, ou encore une commande check_disk_space mal configurée.

          Gaé
          Last edited by gae; 16 May 2007, 11:29.

          Comment


          • #6
            C'est plus cette partie qui m'interroge :
            Code:
            [1179304881] Nagios 2.9 starting... (PID=4910)
            [1179304881] LOG VERSION: 2.0
            [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...


            Voici mon $USER1$=/usr/local/nagios/libexec
            et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

            Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.

            Comment


            • #7
              Originally posted by Krollo View Post
              C'est plus cette partie qui m'interroge :
              Code:
              [1179304881] Nagios 2.9 starting... (PID=4910)
              [1179304881] LOG VERSION: 2.0
              [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
              ->
              [CODE]
              sudo rm /var/log/nagios/nagios.lock
              [CODE]
              puis, vérification si il reste des Nagios qui tournent ...
              Code:
              ps aux | grep 'nagios -d'
              si tu a un ou plusieurs processus de nagios qui tournent :
              pour chaque :
              Code:
              kill (PID)
              ou si il y en a beaucoup /!\ (fait quand même un 'echo sudo kill ... ' pour vérifier avant)
              Code:
              for i in `ps aux | grep 'nagios -d' | awk '{ print $2}'`; do sudo kill "$i"; done
              Originally posted by Krollo View Post
              Voici mon $USER1$=/usr/local/nagios/libexec
              et le check_disk_space=$USER1$/check_nt -H $HOSTADDRESS$ -v USEDDISKSPACE -l $ARG1$ -w $ARG2$ -c $ARG3$ -s "public"

              Sachant que dans le répertoire /usr/local/nagios/libexec/check_nt n'existe pas j'ai renommé le /check_nt_oreon.pl en /check_nt.pl, mais toujours le même message d'erreur.
              dans la définition de ton service :
              remplace check_nt par check_nt.pl !!! normal qu'il ne le trouve pas !!!
              si ca ne marche toujours pas, essaye un :
              Code:
              check_disk_space=[B](path_perl)/perl[/B] $USER1$/check_nt.pl ...
              mais normalement, il n'y a pas besoin si su as compilé nagios avec l'option --enable-perl (au passage, le --enable-perlcash ou un truc du genre va assez bien avec)

              (./configure --help de nagios pour plus d'info sur les options de compilation !!)

              Gaé

              Comment


              • #8
                Déja, Merci Gaé de me répondre.

                Mais en ce qui concerne.

                Code:
                [1179304881] Nagios 2.9 starting... (PID=4910)
                [1179304881] LOG VERSION: 2.0
                [1179304881] Lockfile '/var/log/nagios/nagios.lock' is held by PID 4456.  Bailing out...
                En changeant dans oreon :
                Lock File : /var/log/nagios.lock
                Par:
                Lock File : /var/run/nagios.pid

                Ca marche, comme vous pouvez le voir dans les log :

                Code:
                [1179477144] Successfully shutdown... (PID=5926)
                [1179477144] Nagios 2.9 starting... (PID=5970)
                [1179477144] LOG VERSION: 2.0
                [1179477144] Finished daemonizing... (New PID=5971)
                [1179477144] INITIAL HOST STATE: SBSTAGE;DOWN;HARD;1;Arguments -l erronés.
                [1179477144] INITIAL SERVICE STATE: SBSTAGE;Taille disque;UNKNOWN;HARD;1;Arguments -l erronés.

                Même si j'ai toujours des problèmes comme vous pouvez le voir au dessus, je vous remerci encore de votre aides.

                Comment


                • #9
                  alors, j'ai été confronté au meme probleme que toi au début, apparament puisque t'utilise un redhat 4, je suppose que ta installé nagios via le YUM.
                  Ce que j'ai fait, j'ai été voir dans le fichier nagios.cfg dans /etc/nagios, (packe j'ai pas l'arborescence standard de nagios : /usr/local/nagios) et j'ai rempli l'interface d'oreon en se basant sur le .cfg de nagios par exemple :

                  Log file /var/log/nagios/nagios.log
                  Object Configuration Directory /etc/nagios/
                  Temp File /var/log/nagios/nagios.tmp
                  P1 File /usr/bin/p1.pl
                  Object Cache File /var/log/nagios/objects.cache

                  j'espere ke je t'ai aidé.
                  Mais moi aussi j'avance pas trop, j'ai un probleme de monitoring, je ne vois ni les hosts ni les services.

                  Comment


                  • #10
                    lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

                    http://forum.oreon-project.org/showthread.php?t=3565

                    http://forums.bfl-solutions.eu/viewtopic.php?t=5880

                    Comment


                    • #11
                      Originally posted by Azarius View Post
                      lol anouar j'ai le meme probleme, je ne voit ni les hotes ni les services, et j'ai aussi un probleme comme celui de krollo:

                      http://forum.oreon-project.org/showthread.php?t=3565

                      http://forums.bfl-solutions.eu/viewtopic.php?t=5880
                      On est tous dans la meme galere, alors ce que j'ai fait, j'ai tout pété, et j'ai réinstallé à la main, j'ai réinstallé nagios 2.9, sa compilation s'est bien passé, il comme j'aurai les chemins standard, aprés je suis passé à l'install de perfparse, mais il a merdé lors dans la compil.
                      voila ce qu'il m'affiche :

                      perfchart_png-perfchart.o(.text+0x3a0b):/root/perfparse-0.106.1/cgi/perfchart.c: 295: undefined reference to `gdImagePng'
                      collect2: ld returned 1 exit status
                      make[2]: *** [perfchart.png] Erreur 1
                      make[2]: Leaving directory `/root/perfparse-0.106.1/cgi'
                      make[1]: *** [all-recursive] Erreur 1
                      make[1]: Leaving directory `/root/perfparse-0.106.1'

                      alors si vous avez des suggestions, je vous serai reconnaissant.
                      Merci

                      Comment


                      • #12
                        il te manque peut etre une lib pour perfparse, tu es sur de les avoir tous installés, parce que moi pour nagios j'ai eu le meme probleme et les libgd et libpng était installés dans /usr/local/lib, je les ai copié et collé dans /usr/lib et sa a compiler tout seul

                        après ce n'est pas sur que ce soit les libgd et libpng , mais sa ce pourai au vu de sa "gdImagePng".

                        bon courage

                        Comment


                        • #13
                          Tu as quelle version d'oreon parce que depuis la 1.4 plus besoin de s'embeter avec une installation fastidieuse de perfparse..
                          Oreon 1.4
                          Nagios 2.9
                          RRDTool 1.2.18

                          Comment

                          Working...
                          X