Announcement

Collapse
No announcement yet.

Graphs pleins de trous !

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Graphs pleins de trous !

    Bonjour

    J'ai un souci avec tous mes graph (check_graph_ping, check_graph_nt, ...), et ceci depuis que je suis passé sur la 1.4 avec perfdata. Au bout d'un moment si je ne relance pas ods et Nagios, je n'ai quasiment plus de relevés dans mes graphs (pleins de trous)

    Exemple : J'ai fais un arret/relance de Nagios et ods vendredi apres midi, les graphs n'ont plus de trous jusqu'a lundi matin 0h00, mais apres cela se redégrade , jusqu'a n'avoir qu 1 ou 2 relevé sur 24 heures !

    Help !

    J ai 500 services avec un relevé par service toutes les 5 minutes.

    Je suppose que cela est lié à l'execution des crons d'ods mais la j'ai un peux de mal ! Dans ods_parsing_log j'ai ce message d'erreur :

    DBD::mysql:t fetchrow_hashref failed: fetch() without execute() at /usr/local/oreon/cron/parsing_log.pl line 163.

    Merci d'avance pour votre aide.

    P.S : tous les patchs ont été passés.
    Centreon 2.2.0, Nagios 3.2.3 | 25 Hosts 165 Services
    Modules php-Weathermap 2.0.0
    Debian 6.0 Squeeze Kernel 2.6.32-5-686
    RRDTool 1.4.3
    Apache 2.2.16, PHP 5.3.3-7+squeeze1 et MySQL 5.1.49
    HP xw8400 Bi Xeon 5150 2.66Ghz, Ram 2Go

  • #2
    J'ai exactement le meme pb depuis 2 jours alors que tout marché très bien avant, personne n'as une idée?

    Comment


    • #3
      Tout pareil

      Tout pareil (enfin presque ) que vous.
      Sa commence à partir par des petit trou jusqu'au moment ou sa graphe presque plus. Pourtant les .rrd sont bien mis à jours ....

      J'ai comme qui dirai l'impression que le parsage foire à fond.

      Suggestion : malgrès l'ordonnanceur de LINUX n'est t'il pas possible que lorsque ods suprime le fichier nagios/var/service-perfdata il supprimer parfois (voir presque tout le temps) les données poosées par le plugin nagios process-service-perfdata ?????

      Juste question, supposition ....
      RHEL 5.8 , Centreon 2.5

      Comment


      • #4
        même probléme !
        si il y a des solutions n'hésité pas!!
        Fedora 8
        Nagios 2.11
        Plugins-nagios 1.4.11
        Centreon 1.4.2.4
        Pour une bonne petite doc c'est ICI

        Comment


        • #5
          apparement ca devient généralisé ce pb sur la 1.4 ... c'est un peu genant qd meme.

          Comment


          • #6
            Oui mais les dev ont annoncé qu'ils ne maintiendraient pas perf ni les graph plugin alors faite comme moi, passez à ODS (et galèrez à la mise en place)
            Debian r4 - Nagios 2.9 - Oreon 1.4
            rrdtool 1.2 - plugin 1.4.8

            Comment


            • #7
              Bonjour
              Je n'ai plus du tout ce souci, j'ai des graph niquel depuis Vendredi. En fait je n'ai fait qu'une seule modif :

              - Dans le fichier Oreon se trouvant dans /etc/cron.d/ j ai remarqué que la première ligne ne pointait pas inventory_update.php au bon endroit, j'ai plus l'ancien chemin en tête mais le nouveau chez moi c est /usr/local/oreon/cron/inventory_update.php (même le nom du fichier a changé). Cela vient-il des patchs ? Ai-je oublié une manip ? En tout cas cela a solutionné mon problème.

              La seul autre action que j'ai effectué sur mon serveur est de redémarrer ODS sans arrêter Nagios, mais je ne pense pas que cela ai changé quoi que ce soit.
              Centreon 2.2.0, Nagios 3.2.3 | 25 Hosts 165 Services
              Modules php-Weathermap 2.0.0
              Debian 6.0 Squeeze Kernel 2.6.32-5-686
              RRDTool 1.4.3
              Apache 2.2.16, PHP 5.3.3-7+squeeze1 et MySQL 5.1.49
              HP xw8400 Bi Xeon 5150 2.66Ghz, Ram 2Go

              Comment


              • #8
                P.S : mon probleme était avec ODS et non perfdata, que je n'ai jamais intégré d'ailleur (passé direct de RRD à ODS)
                Centreon 2.2.0, Nagios 3.2.3 | 25 Hosts 165 Services
                Modules php-Weathermap 2.0.0
                Debian 6.0 Squeeze Kernel 2.6.32-5-686
                RRDTool 1.4.3
                Apache 2.2.16, PHP 5.3.3-7+squeeze1 et MySQL 5.1.49
                HP xw8400 Bi Xeon 5150 2.66Ghz, Ram 2Go

                Comment


                • #9
                  Hum hum

                  Soit je n'ai rien compri au fonctionnement de Oreon soit ya comme qui dirai un petit souci ...

                  Lorsque je parle de parse ou perfparse, c'est ods qui en a besoin.

                  Explication à ma sauce : le parsage permet de mettre en forme les valeur remonter par nagios pour qu'elle soit lisible par le cron ods.

                  C'est perfgraph qui va être mis à la trappe et par le perfparse qui je suppose est indispensable pour ods .... surtout sur des plugins n'étais pas des check_graph_*

                  Je me plante, je doi revoir ma copie ?
                  Last edited by pastaguas; 7 May 2007, 10:05.
                  RHEL 5.8 , Centreon 2.5

                  Comment


                  • #10
                    Originally posted by pleclerc View Post
                    Bonjour
                    Je n'ai plus du tout ce souci, j'ai des graph niquel depuis Vendredi. En fait je n'ai fait qu'une seule modif :

                    - Dans le fichier Oreon se trouvant dans /etc/cron.d/ j ai remarqué que la première ligne ne pointait pas inventory_update.php au bon endroit, j'ai plus l'ancien chemin en tête mais le nouveau chez moi c est /usr/local/oreon/cron/inventory_update.php (même le nom du fichier a changé). Cela vient-il des patchs ? Ai-je oublié une manip ? En tout cas cela a solutionné mon problème.

                    La seul autre action que j'ai effectué sur mon serveur est de redémarrer ODS sans arrêter Nagios, mais je ne pense pas que cela ai changé quoi que ce soit.
                    http://forum.oreon-project.org/showt...?t=3048&page=3
                    Centreon 2.x

                    Comment


                    • #11
                      Effectivement j ai voulus aller trop vite, j'ai inversé perfdata et perfparse. Autant pour moi ...
                      Centreon 2.2.0, Nagios 3.2.3 | 25 Hosts 165 Services
                      Modules php-Weathermap 2.0.0
                      Debian 6.0 Squeeze Kernel 2.6.32-5-686
                      RRDTool 1.4.3
                      Apache 2.2.16, PHP 5.3.3-7+squeeze1 et MySQL 5.1.49
                      HP xw8400 Bi Xeon 5150 2.66Ghz, Ram 2Go

                      Comment


                      • #12
                        Originally posted by pastaguas View Post
                        Soit je n'ai rien compri au fonctionnement de Oreon soit ya comme qui dirai un petit souci ...


                        Je me plante, je doi revoir ma copie ?
                        la oui !! désolé mais je confirme

                        Originally posted by pastaguas View Post
                        Lorsque je parle de parse ou perfparse, c'est ods qui en a besoin.

                        Explication à ma sauce : le parsage permet de mettre en forme les valeur remonter par nagios pour qu'elle soit lisible par le cron ods.

                        C'est perfgraph qui va être mis à la trappe et par le perfparse qui je suppose est indispensable pour ods .... surtout sur des plugins n'étais pas des check_graph_*
                        1) Nagios effectue des check de services qui sont intermretés OK, WARNING, CRITICAL ou UNKNOWN et c'est tout. Ces états sont déterminés en fonction des valeurs limites que tu passes en paramètres aux plugins.

                        2) Comme Nagios est un logiciel bien pensé et très modulaire, des éléments autres que les données dont Nagios à besion peuvent être utilisés pour faire ce que l'on veut par derrière : ce sont les éléments dits "perfdata" (données de performances).
                        Les données de performances passent des plugins vers Nagios, Nagios ne les interprète pas mais fournit des macros et autres solutions pour les transferer à une application tiers.

                        3) les applications tiers utilisent ces données pour effectuer ce qu'elles veullent : stats ... et pour ce qui nous intéresse ici : les graphs !!
                        3.1) la solution Perfparse :
                        c'est un parser libre qui parse et interprete les données de performance pour les "transformer" en graphs. Il est un peu historique : existe depuis longtemps, mais n'est plus maintenu non plus depuis longtemps !!
                        Oreon utilisait ce logiciel pour intégrer les graphs dans son interface.
                        3.2) autre soluton pur Oreon :
                        Le team Oreon a développé des plugins particuliers pour generer dirrectement des graphs sans passer par les données perfdata de Nagios. Ces plugins incerent les données dirrectement dans des fichiers RRD.
                        3.3) la nouvelle solution ODS
                        les deux solutions précédentes posent deux problèmes :
                        Perfparse : logiciel qui n'est plus maintenu, et par dessus le marcé qui est assez compliquer à installer et à mettre en oeuvre (compil Nagios spéciale ...)
                        Les graphs par plugin : il faut impérativement utiliser un plugin spécifique pour pouvoir grapher les données voulues et il faut donc développer un plugin spécifique pour chaque type de graphs que tu veux faire -> lourd, pas tres évolutifs pour les utilisateurs qui sont dépendants de ces plugins et pas très cool pour l'équipe de dev qui doit se retaper tous les plugins imaginables alors qu'ils ont déjà été développés indémendemment ! De plus, les perfdata sont bien prises en compte par les developpeurs de plugins qui les utilisent déjà à la base !

                        -> la solution : reprendre le principe de perfparse avec l'utilisation des données de performance (ie les perfdata) avec une solution home maid completement maitrisée et intégrée à oreon -> création d'ODS
                        -> a terme : seul ODS devrait subsister avec Oreon, ce qui simplifira grandement tous les petits problèmes rencontrés par les utilisateurs.

                        ...
                        de mon point de vue (j'ai testé les 3 solutions) :
                        ODS est vraiement la meilleur solution : pas de galère pour l'install comme j'ai pu en avoir avec Perfparse, on peut TOUT grapher, monitorer ... comme on veut, pourvu qu'on utilise les données perfdata
                        ...

                        l'explication que je donne est un point de vue personnel mais je pense qu'il n'est pas loin de celui de l'équipe de dev Oreon.

                        pour des infos complémentaires sur les perfdata : voir doc Nagios et le wiki Oreon rubriques "plugins" et "graphs"

                        Gaé

                        Comment


                        • #13
                          Une solution

                          aller une petite solution que je vous propose après pas mal de recherche et qui est confirmée par les résultat de nouvo présent :


                          Allez jeter un petit coup d'oeil à votre lantence de nagios :
                          ==> soit par http dans le menu : Performance Info
                          ==> soit exécuter /nagios/bin/nagiostat

                          Donner un peu les valeur de vos Check Latency pour hosts et service

                          Information : ces valeurs doivent être comprise entre 0 et 1 voir 0 pour une latence parfaite ....


                          NB : très méchant je suis car je commençais à croire que Oreon partait en couille mais en fait cté un problème de configuration de ma part : dsl au dev de Oreon
                          RHEL 5.8 , Centreon 2.5

                          Comment


                          • #14
                            Originally posted by pastaguas View Post
                            aller une petite solution que je vous propose après pas mal de recherche et qui est confirmée par les résultat de nouvo présent :


                            Allez jeter un petit coup d'oeil à votre lantence de nagios :
                            ==> soit par http dans le menu : Performance Info
                            ==> soit exécuter /nagios/bin/nagiostat

                            Donner un peu les valeur de vos Check Latency pour hosts et service

                            Information : ces valeurs doivent être comprise entre 0 et 1 voir 0 pour une latence parfaite ....


                            NB : très méchant je suis car je commençais à croire que Oreon partait en couille mais en fait cté un problème de configuration de ma part : dsl au dev de Oreon
                            c'est quoi la procedure de ta solution apres avoir vu /usr/local/nagios/bin/nagiostats, j'ai pas saisi ...
                            moi j'ai ca :
                            Code:
                            Total Services:                       462
                            Services Checked:                     462
                            Services Scheduled:                   462
                            Active Service Checks:                462
                            Passive Service Checks:               0
                            Total Service State Change:           0.000 / 44.140 / 1.199 %
                            Active Service Latency:               1148.481 / 1178536249.324 / 22959744.208 %
                            Active Service Execution Time:        0.112 / 19.135 / 4.793 sec
                            Active Service State Change:          0.000 / 44.140 / 1.199 %
                            Active Services Last 1/5/15/60 min:   31 / 111 / 268 / 462
                            Passive Service State Change:         0.000 / 0.000 / 0.000 %
                            Passive Services Last 1/5/15/60 min:  0 / 0 / 0 / 0
                            Services Ok/Warn/Unk/Crit:            306 / 3 / 125 / 28
                            Services Flapping:                    0
                            Services In Downtime:                 0
                            
                            Total Hosts:                          51
                            Hosts Checked:                        51
                            Hosts Scheduled:                      51
                            Active Host Checks:                   51
                            Passive Host Checks:                  0
                            Total Host State Change:              0.000 / 0.000 / 0.000 %
                            Active Host Latency:                  0.000 / 1352.851 / 565.193 %
                            Active Host Execution Time:           2.116 / 12.147 / 2.538 sec
                            Active Host State Change:             0.000 / 0.000 / 0.000 %
                            Active Hosts Last 1/5/15/60 min:      10 / 24 / 45 / 51
                            Passive Host State Change:            0.000 / 0.000 / 0.000 %
                            Passive Hosts Last 1/5/15/60 min:     0 / 0 / 0 / 0
                            Hosts Up/Down/Unreach:                49 / 2 / 0
                            Hosts Flapping:                       0
                            Hosts In Downtime:                    0

                            Comment


                            • #15
                              Petit comparatif voila les deux lignes importantes :

                              chez toi :
                              HTML Code:
                              Active Service Latency:               1148.481 / 1178536249.324 / 22959744.208 %
                              HTML Code:
                              Active Host Latency:                  0.000 / 1352.851 / 565.193 %
                              chez moi :
                              HTML Code:
                              Active Service Latency:               0.154 / 1.035 / 0.557 sec
                              HTML Code:
                              Active Host Latency:                  0.000 / 0.976 / 0.406 sec
                              Je pense que tu vois un peu la différence.

                              Ce que je te conseil de faire pour résoudre rapidement ton problème dans un premier temps c de passer la valeur "Nombre maximum d'essais" de tes service à 2 et non pas à 10 comme je suppose que tu l'ai en ce moment.

                              De plus applique cela à tes hosts sur la même variable

                              ATTENTION : ne croi pas que sa va marcher sur l'instant. Soit un peu passiant regarde de temps en temps ta latente tu verra qu'elle diminiuera progressivement.
                              Et comme par magie tes graph retrouverront un esprit graphique c'est à dire sans trou et avec des tracer


                              Pour finir je te conseil de lire ceci pour pauffiner le tout :
                              http://nagios.manubulon.com/traducti....5/tuning.html

                              Je n'ai pas encore bien saisis ce que peu representer la latence, je crois que j'ai compri le principale reste à savoir si mes connaissance sont bonnes donc pour le moment je ne me prononcerai pas sur le pourquoi du comment....

                              Voila j'espère que sa aidera des gens
                              RHEL 5.8 , Centreon 2.5

                              Comment

                              Working...
                              X