Announcement

Collapse
No announcement yet.

Upgrade en 1.4.1 RC1 : problèmes sur problèmes

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Upgrade en 1.4.1 RC1 : problèmes sur problèmes

    Bonjour.
    Je viens de finir l'upgrade de la version 1.4 vers 1.4.1 RC, et j'ai plusieurs problèmes :

    Le plugin "check_centreon_snmp_remote_storage" ne graph pas, il remonte des informations mais pas celle de "performances"

    Apache consomme 3 fois plus de CPU si je décoche "Lecteur rapide des status" et si je coche plus de monitoring.

    Configuration :
    Nagios 2.9 et Oreon 1.4.1 RC1
    bi proc, 4 Go de RAM

  • #2
    Donc ne coche pas.

    L'utilisation de cette option est liee a la mise en place d'un cron qui va decouper le fichier de log de Nagios pour en accelerer la lecture.
    C'est surtout utile quand il fait plusieurs dizaines de Mo...

    Sinon pour le plugin, lance le en ligne de commande pour bien voir la sortie, et passe peut etre l'option -f ;-)
    Romain Le Merlus
    Centreon Forge
    MERETHIS

    Comment


    • #3
      Originally posted by rom View Post
      Donc ne coche pas.
      Sinon pour le plugin, lance le en ligne de commande pour bien voir la sortie, et passe peut etre l'option -f ;-)
      Arf c'est fourbe ça !
      Elle est pas documentée (dans le --help ) mais ça marche !!! Je viens de tester...

      Comment


      • #4
        Merci, je l'avais oublié cette -f... Les données de performances sont OK.
        Par contre, je n'arrive pas à afficher des graphs, la base ODS à l'air de s'alimenter...

        Je ne trouve pas de .rrd mis à part les anciens générés par les check_graphs...

        EDIT2 : j'ai mis les droits nagios.nagios sur le répertoir OreonDataStorage, et là j'ai des fichers .rrd
        Last edited by Mseuda; 25 July 2007, 18:19.

        Comment


        • #5
          Les droits doivent etre nagios.nagiosgroup

          Pour :
          oreon/OreonDataStorage
          oreon/ODS/var
          oreon/ODS/ods

          Dans l'install 1.4.1-RC1 (pas de migration), le path des bases rrd est :
          /var/lib/ods/database a la place de oreon/OreonDataStorage

          Pas de graph, as tu suivi le wiki dans le cas d'une migration, as tu lance le script renameDS ? Si tes bases rrd s'alimentent, et que des rrdtool info te sortent des trucs interessants, tu dois plus etre tres loin.
          Romain Le Merlus
          Centreon Forge
          MERETHIS

          Comment


          • #6
            Bonjour.
            Ok pour les droits.
            Ok pour les graphs.
            Et bien entendu merci.

            Par contre, j'ai toujours un problème de charge du daemon httpd. Depuis la migration, j'ai plusieurs processus httpd entre 50 et 100% d'utilisation du CPU. Avant la 1.4.1 RC1, j'avais un loadaverage de 1,5 à 2,5, maintenant je suis de 10 à 12 !! Je trouve ça d'autant plus étrange que j'ai envelé un grand nombre de check inutile.

            Aucune modification sur Apache n'a été faite.

            Je cherche une réponse de mon côté, mais si vous avez déjà eu une remontée sur le même type d'incident,, je suis intéressé

            Serveur : bi-pro à 3Ghz, 6Go de ram

            Comment


            • #7
              Originally posted by Mseuda View Post
              EDIT2 : j'ai mis les droits nagios.nagios sur le répertoir OreonDataStorage, et là j'ai des fichers .rrd
              erreur corrigé pour la RC2 !
              Julien Mathis
              Centreon Project Leader
              www.merethis.com |

              Comment


              • #8
                Originally posted by julio View Post
                erreur corrigé pour la RC2 !
                Ok pour la RC2, et surtout bon courage.

                Par contre, le loadaverage se dégrade complètement, je suis entre 14 et 16 maintenant, autrement dis l'interface Oreon est inutilisable, c'est long à l'affichage, les graphs sont plein de trous, .... :confused:

                J'ai remarqué la chose suivante :
                Si j'active l'option : Options >Oreon>Options Générales>CentreonDataStorage>Lecture rapide des Status
                Le loadaverage du serveur revient à la normale (même moins !) entre 1.5 et 2.5, mais le monitoring est à 0 pour les hosts et les services.
                Si je dé-active l'option : Lecture rapide des Status, le loadaverage remonte à 14/16. J'ai 6 processus Apache qui consomment en permance toute la puissance CPU.

                Je suis entrain tracer complètement Apache... mais je pense que c'est directement lié à cette option.

                Merci d'avance.

                Comment


                • #9
                  Ha nan c'est du au nombre d'hosts et de services que tu monitore. Combien de Mo pour le fichier status.log dans le var de nagios ?

                  Ce fichier est lu à chaque fois que tu regarde une page dans oreon au niveau monitoring.

                  Pour améliorer le truc deja, augmente le temps de rafraichissement dans les options générales, aggreges les status dans nagios.cfg.

                  si genre ce fichier fait 9Mo c'est trop important. Il faut alors activer la lecture rapide des logs pour que ca prenne moins de temps. Le fichier sera si je ne me trompe pas 15 fois plus petit...

                  J'ai développé ce truc pour un client qui avait un fichier de status de 9Mo (6000 hosts environs et heuresement pas bcp de services). On etait a plus de 35 s de lecture pour une page, on est descendu a 2 s je crois. Et le Load est stable a moins de 1. (bcp de choses en passif)

                  On ne pourra pas faire mieux. Il faudra ensuite passer a NDO, avec les status en base de données. Mais je n'ai aucun retour. Je ne l'ai jamais mis en prod a grande echelle. Je ne sais pas ce que ca donne, mais c'est sur qu'on gagnera du temps CPU.

                  QQ un a une experience avec NDO ? juste une idée, savoir si ca marche bien ?

                  Sinon pour la lecture rapide des status, tu dois avoir un fichier de status.log genre status_fast.log qui est créé dans le var de nagios. Il est rempli chez toi ?

                  Merci ++
                  Julien Mathis
                  Centreon Project Leader
                  www.merethis.com |

                  Comment


                  • #10
                    Originally posted by julio View Post
                    Ha nan c'est du au nombre d'hosts et de services que tu monitore. Combien de Mo pour le fichier status.log dans le var de nagios ?

                    Ce fichier est lu à chaque fois que tu regarde une page dans oreon au niveau monitoring.

                    Pour améliorer le truc deja, augmente le temps de rafraichissement dans les options générales, aggreges les status dans nagios.cfg.

                    si genre ce fichier fait 9Mo c'est trop important. Il faut alors activer la lecture rapide des logs pour que ca prenne moins de temps. Le fichier sera si je ne me trompe pas 15 fois plus petit...

                    J'ai développé ce truc pour un client qui avait un fichier de status de 9Mo (6000 hosts environs et heuresement pas bcp de services). On etait a plus de 35 s de lecture pour une page, on est descendu a 2 s je crois. Et le Load est stable a moins de 1. (bcp de choses en passif)

                    On ne pourra pas faire mieux. Il faudra ensuite passer a NDO, avec les status en base de données. Mais je n'ai aucun retour. Je ne l'ai jamais mis en prod a grande echelle. Je ne sais pas ce que ca donne, mais c'est sur qu'on gagnera du temps CPU.

                    QQ un a une experience avec NDO ? juste une idée, savoir si ca marche bien ?

                    Sinon pour la lecture rapide des status, tu dois avoir un fichier de status.log genre status_fast.log qui est créé dans le var de nagios. Il est rempli chez toi ?

                    Merci ++
                    1 - Le status.log fait 892K.
                    2 - j'ai mis les tps de rafaichissement à 60 secondes partout.
                    3 - Agregation des status dans le nagios.cfg (option déjà active)
                    4 - pas de fichier status_fast.log mais un fichier status.log_light à 0K
                    5 - je ne sais même pas ce que c'est NDO

                    Merci à toi surtout.

                    Comment


                    • #11
                      normalement si ton fichier est bien rempli ca devrait marcher dans la monitoring..

                      Tu as bien nagios 2.X ??
                      Julien Mathis
                      Centreon Project Leader
                      www.merethis.com |

                      Comment


                      • #12
                        Originally posted by julio View Post
                        normalement si ton fichier est bien rempli ca devrait marcher dans la monitoring..

                        Tu as bien nagios 2.X ??
                        Voui, Nagios 2.9 sur RedHat AS 4.
                        Le status.log_light est vide, et j'ai décoché la "lecture rapide des status".
                        J'ai remarqué que le load est descendu entre 8 et 10 maintenant, mais je ne sais pas pourquoi, rien n'a été modifié. :confused:

                        Comment

                        Working...
                        X