Announcement

Collapse
No announcement yet.

Pourquoi le tracé des graphiques cesse ???

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • #16
    Salut:

    Si je fait une regénération le step = heartbeat. Sinon oui j'ai mis le heartbeat à 600 à la main mais je pense pas que ca vienne de cette modif parce que ca c'est mis a fonctionner presque 5 jours apres la modif.

    Comment


    • #17
      Bon, j'ai du réinstaller Centreon sur une nouvelle bécane.

      J'ai modifié les ordonnancements réguliers et check host à 5' (au lieu de 1' auparavant), les ordonnancements irréguliers à 10'.
      Les graphiques fonctionnent, les steps et heartbeat sont à 310. Donc il semblerait que les valeurs de heartbeat=valeur ordonnacement régulier en seconde+10 (quand j'avais paramétré l'odonnacement à 1', j'avais pour valeur de step et hearbeat 70). Me trompje ?
      Je vais laisser ces valeurs par défaut pour voir...

      A+
      SLES 10 + Nagios 2.9 + Nagios-plugins 1.4.9 + Centreon 1.4.1

      http://ricassou.miniville.fr

      Comment


      • #18
        Il faudra demander confirmation a Julio, mais d'apres ce que j'ai compris, le heartbeat est egal au normal_check_interval (en secondes) + 30 secondes.

        Face au nombre important de posts qui traduit des problemes, je pense que ce seuil va etre augmenté, et pourquoi pas tout simplement heartbeat = 2 x normal_check_interval, comme tout le monde le reclame.

        Alors vu que vous etes en 1.4.1, c'est normal que quand vous tunez a la main vos bases, elles prennent la valeur que vous indiquez. Maintenant si vous passez apres via l'interface, la methode de calcul du heartbeat n'a pas changée, il faut donc attendre la 1.4.2 ou un patch pour resoudre votre probleme. Mais c'est une bonne nouvelle, on avance :-) On peut donc dire que dans la 1.4.2, les graphs seront parfaits ;-)
        Romain Le Merlus
        Centreon Forge
        MERETHIS

        Comment


        • #19
          Pas de soucis... si on s'entraide tous on va s'en sortir... Puis on va commencer à le connaitre Centreon ;-)

          Comment


          • #20
            Meme punition ... meme motif
            et j'ai remarqué que le fichier de log ne bougeait plus du tout (/usr/local/oreon/ODS/var/ods.log) sauf pour le start de ODS

            Suis je le seul ? est ce lié ? ca fait avancé le truc ?

            edit : j'ai aussi ce message la ....
            Use of uninitialized value in string ne at /usr/local/oreon/ODS/lib/identitifyMetric.pm line 87, <PFDT> line 28

            Ca parle a quelqu'un ?
            icedance
            Member
            Last edited by icedance; 23 August 2007, 18:39.
            Nagios 2.9 - Centreon 1.4 - Plugins 1.4.9
            200 host - 400 services - 50 graphs ( sans trous )
            NTOP-1.3 + PHP WeatherMap 1.2 + Nagios status map module 1.1 + manubulon plugins
            Dell optiplex 745 Core2 Duo 3giga - 1 giga de ram + Ubuntu Feisty Fawn

            Comment


            • #21
              Tout mes graphs se sont arrêtés au bout de 4 jours environ :/

              Comment


              • #22
                moi ça fait un bon moment que je n'ai plus de graphs non plus ... j'ai tenté de tuner mes rrd à la main j'ai revérifié à maintes reprises la configuration... mais toujours rien....

                Comment


                • #23
                  Le serveur que j'ai mis en place doit superviser un réseau composé comme suit :

                  - 31 serveurs avec 3 services chacun.
                  - 30 switchs avec 1 service par port. (50 ports/switch)

                  cette supervision nécessite donc environ 1 600 services.

                  Après avoir testé le fonctionnement de chaque service sur un hote standart(switch & serveur), l'ensemble des services tournaient correctement sans erreur et graphaient parfaitement. (sauf que bizarrement, les graphs ne se faisait que le jour de 8H00 à 18H00 alors qu'il etaient configuré pour 7X24).

                  J'ai configuré la totalité des hotes et des services, j'ai chargé la configuration, et là, d'une part, il était évident que la machine sur laquelle tournait nagios était trop peu puissante, mais en plus il a stoppé tous les graphs et ne les a jamais repris, meme apres avoir fini de bien chargé les hotes et services. (config serveur test : débian etch avec 1MO de swap + P4 1.6 avec 512 MO RAM)

                  Il me semblait donc evident que d'une part la machine était pas adapté, mais que c'etait aussi la cause de l'arret total des graphs. j'ai donc supprimer la majorité des services et j'ai réinitialisé le tout, et mes graphiques ont repris comme avant.

                  Je me demandais donc en lisant tous les soucis de graphs, si les nombre de services et la puissance des machines sur lesquels vous faites tourner nagios n'ont pas un rapport également avec l'absence de graphs ?

                  ceci n'expliquant pas malgré tout pourquoi mes graphs se stoppent d'environ 18H00 à 8H00 environ ?

                  j'ai appliqué le script suivant
                  #!/bin/sh
                  cd /var/lib/ods/database
                  for f in *.rrd; do rrdtool tune $f --heartbeat metric:600; done
                  exit 0
                  pour tester de remédier a ca mais il me repond : ERROR: unknow data source name 'metric'

                  ci ces quelques infos peuvent aider ?

                  Comment


                  • #24
                    Bonjour à tous,

                    Finalement j'ai encore des soucis de graphes, très hachés ou plus du tout

                    Si je mets la metric à 900 au lieu de 600, cela remarchera ?

                    Comment


                    • #25
                      wé bin pareil, des graphes qui marchent et qui marchent pu, comme a peu pres un user sur 2 d'oreon a priori oO. Les dev d'oreon semeblent avoir deserté le forum, ou alors c'est pas bien grave si ca ne graphe pas on dirait.

                      Donc si quelqu'un aurait une SOLUTION DEIFNITIVE a l'arrete des graphes, ce serait une bonne idée de la détailler plutot que de faire galerer de multiples users sur ce sujet la. (Il faut voir le nombre de posts créesa cet effet dernierement....)
                      Centreon 1.4
                      Nagios 2.9
                      Suse 10.2

                      Comment


                      • #26
                        Salut,

                        Je n'ai jamais eu problème sur les graphs... Ca ne pourrai pas etre du un problème de place coté BDD ou system (la ou tu mets les RRD) ???

                        Tu suppervises ta machine Nagios ? Regarde les graphs coté loadaverage, cpu, mem... (enfin les derniers graphs que tu as). On ne sais jamais, ca pourra te dire si ton système est en cause, pas assez de RAM/CPU...

                        Tu as regardé coté log ODS ?
                        Centreon 2.x

                        Comment


                        • #27
                          un apercu de mon ods.log :
                          Code:
                          1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188788292 -> 4.45155e+09 : illegal attempt to update using time 1188788292 when last update time is 1188788292 (minimum one second step)
                          1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188804986 -> 4.44871e+09 : illegal attempt to update using time 1188804986 when last update time is 1188804986 (minimum one second step)
                          1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188807617 -> 4.45704e+09 : illegal attempt to update using time 1188807617 when last update time is 1188807617 (minimum one second step)
                          1189511858 - ERROR while updating /usr/local/oreon/OreonDataStorage/228.rrd at 1188807986 -> 4.45704e+09 : illegal attempt to update using time 1188807986 when last update time is 1188807986 (minimum one second step)
                          1189511858 - 35585 value insert
                          1189683177 - Receiving order to stop...
                          1189683181 - Stopping ODS engine...
                          1189683344 - Starting ODS engine...
                          1189683344 - PID : 2184
                          1189762576 - Receiving order to stop...
                          1189762579 - Stopping ODS engine...
                          1189762580 - Starting ODS engine...
                          1189762580 - PID : 24627
                          1189762580 - Creating /usr/local/oreon/OreonDataStorage/275.rrd -b 1189557365, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                          1189762580 - Creating /usr/local/oreon/OreonDataStorage/276.rrd -b 1189557365, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                          1189768589 - Creating /usr/local/oreon/OreonDataStorage/277.rrd -b 1189568374, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                          1189768589 - Creating /usr/local/oreon/OreonDataStorage/278.rrd -b 1189568374, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                          sinon pas de souvcis niveau machine, elle a tout ce qu il faut pour bosser et est 100% stable.
                          Centreon 1.4
                          Nagios 2.9
                          Suse 10.2

                          Comment


                          • #28
                            Non mais non
                            ca viens pas des ressources c'est forcement autre chose
                            moi j'ai doublé la Ram de ce que j'utilise ... pas de changement ...
                            et le processeur est loin d'être sur les genoux
                            et les log ODS a par nous dire que tout fonctionne et qu'il rentre les informations corectement en créant une nouvelle RDD ...

                            Combien tu supervises de host pour pas avoir de soucis?
                            Combien graph ?

                            Et pour essayé de se sortir de ce truc si on pouvait répondre a ca :
                            http://forum.oreon-project.org/showthread.php?t=4650

                            merci


                            edit :

                            allé je montre :

                            Graph qui fonctionne presque bien :
                            http://img101.imageshack.us/img101/2...p171239ly8.gif

                            Graph qui fonctionen pas du tout :
                            http://img262.imageshack.us/img262/1...p171239oj0.gif

                            Load machine en pique ( sachant que j'ai déjà doubler la ram et que ca n'a rien fait donc :
                            http://img390.imageshack.us/img390/4...p171240bs7.gif

                            Le code d'un fichier rrd.

                            Code:
                            filename = "/usr/local/oreon/ODS/8773.rrd"
                            rrd_version = "0003"
                            step = 130
                            last_update = 1190025797
                            ds[traffic_out].type = "GAUGE"
                            ds[traffic_out].minimal_heartbeat = 130
                            ds[traffic_out].min = NaN
                            ds[traffic_out].max = NaN
                            ds[traffic_out].last_ds = "UNKN"
                            ds[traffic_out].value = NaN
                            ds[traffic_out].unknown_sec = 77
                            ...
                            et mon log de ODS


                            Code:
                            1189675805 - Starting ODS engine...
                            1189675805 - PID : 5872
                            1189675805 - Creating /usr/local/oreon/ODS/8642.rrd -b 1189474563, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                            1189675806 - Creating /usr/local/oreon/ODS/8643.rrd -b 1189474563, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                            1189675806 - Creating /usr/local/oreon/ODS/8644.rrd -b 1189474564, -s 70, DS:traffic_in:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286 RRA:MIN:0.5:12:450514.285714286 RRA:MAX:0.5:12:450514.285714286
                            1189675806 - Creating /usr/local/oreon/ODS/8645.rrd -b 1189474564, -s 70, DS:traffic_out:GAUGE:70:U:U RRA:AVERAGE:0.5:1:450514.285714286
                            icedance
                            Member
                            Last edited by icedance; 17 September 2007, 14:02.
                            Nagios 2.9 - Centreon 1.4 - Plugins 1.4.9
                            200 host - 400 services - 50 graphs ( sans trous )
                            NTOP-1.3 + PHP WeatherMap 1.2 + Nagios status map module 1.1 + manubulon plugins
                            Dell optiplex 745 Core2 Duo 3giga - 1 giga de ram + Ubuntu Feisty Fawn

                            Comment


                            • #29
                              Originally posted by lowdata View Post
                              wé bin pareil, des graphes qui marchent et qui marchent pu, comme a peu pres un user sur 2 d'oreon a priori oO.
                              Les dev d'oreon semeblent avoir deserté le forum, ou alors c'est pas bien grave si ca ne graphe pas on dirait.
                              Euh non, on connait le probleme, des reponses ont ete donnees, mais comme tu dis "un user sur 2" post au lieu de chercher, donc ca devient illisible.

                              Originally posted by lowdata View Post
                              Donc si quelqu'un aurait une SOLUTION DEIFNITIVE a l'arrete des graphes, ce serait une bonne idée de la détailler plutot que de faire galerer de multiples users sur ce sujet la.
                              J'invite donc demain, ceux qui ont des problemes a me transmettre par MP des identifiants de connexion sur leur plateforme, ce qui me permettra de valider que la correction fonctionne partout, et on vous sort un truc dans le wiki dans la foulee.
                              Romain Le Merlus
                              Centreon Forge
                              MERETHIS

                              Comment


                              • #30
                                J'invite donc demain, ceux qui ont des problemes a me transmettre par MP des identifiants de connexion sur leur plateforme, ce qui me permettra de valider que la correction fonctionne partout, et on vous sort un truc dans le wiki dans la foulee.
                                Tu parles des betas testeurs la non ?
                                Nagios 2.9 - Centreon 1.4 - Plugins 1.4.9
                                200 host - 400 services - 50 graphs ( sans trous )
                                NTOP-1.3 + PHP WeatherMap 1.2 + Nagios status map module 1.1 + manubulon plugins
                                Dell optiplex 745 Core2 Duo 3giga - 1 giga de ram + Ubuntu Feisty Fawn

                                Comment

                                Working...
                                X