Announcement

Collapse
No announcement yet.

Graphes vides + erreurs dans les logs

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Graphes vides + erreurs dans les logs

    Bonjour,

    Et oui, encore des graphes vides :-|. Alors voila, 2 problemes en fait:

    Les graphes fonctionnaient tres bien jusqu'a hier, avec cependant des messages du type "ERROR while updating /usr/local/oreon/rrd//559.rrd : illegal attempt to update using..." dans ods.log. Soit, ça fonctionnait tres bien donc j'avais laissé tombé ces erreurs.

    Hier soir j'ai rajouté plein de hosts et d'un coup les graphes se sont arretés, avec dans un premier temps quelques points, puis plus rien. Quand je dis j'ai rajouté plein de hosts, par rapport à la puissance du serveur (Bi Xeon + 4go de RAM) et par rapporta ce que Nagios semble pouvoir monitoré, c'est ridicule. J'ai actuellement 30 hosts et 160 services.

    Donc depuis, j'ai des entrées dans ods.log de
    * ERROR while updating /usr/local/oreon/rrd//536.rrd : illegal attempt to update using time
    * Warning : /usr/local/oreon/rrd//xx_y.rrd removed
    le fichier epn_leave-msgs.log contient des "eval_file: /usr/lib/nagios/plugins//check_graph_traffic.pl already successfully compiled and file has not changed; skipping compilation"
    perfdata-service.log et perfdata-host.log se remplissent

    Si qq a une idée...
    Last edited by clifden; 11 May 2007, 19:06. Reason: Subject change
    Sysadmin
    OS: Ubuntu / Debian / RHEL
    Nagios env: 1 centreon 2.2.1, 5 Nagios on remote sites, NDOutil v1.4.9
    Own development: status map based on NDO, service status by categories, misc reports on nagios conf, mediawiki linked to centreon and vis-versa

  • #2
    Originally posted by clifden View Post
    Bonjour,

    Et oui, encore des graphes vides :-|. Alors voila, 2 problemes en fait:

    Les graphes fonctionnaient tres bien jusqu'a hier, avec cependant des messages du type "ERROR while updating /usr/local/oreon/rrd//559.rrd : illegal attempt to update using..." dans ods.log. Soit, ça fonctionnait tres bien donc j'avais laissé tombé ces erreurs.

    Hier soir j'ai rajouté plein de hosts et d'un coup les graphes se sont arretés, avec dans un premier temps quelques points, puis plus rien. Quand je dis j'ai rajouté plein de hosts, par rapport à la puissance du serveur (Bi Xeon + 4go de RAM) et par rapporta ce que Nagios semble pouvoir monitoré, c'est ridicule. J'ai actuellement 30 hosts et 160 services.

    Donc depuis, j'ai des entrées dans ods.log de
    * ERROR while updating /usr/local/oreon/rrd//536.rrd : illegal attempt to update using time
    * Warning : /usr/local/oreon/rrd//xx_y.rrd removed
    le fichier epn_leave-msgs.log contient des "eval_file: /usr/lib/nagios/plugins//check_graph_traffic.pl already successfully compiled and file has not changed; skipping compilation"
    perfdata-service.log et perfdata-host.log se remplissent

    Si qq a une idée...
    Pour completer, voici ce que j'ai disgnostiqué:
    * fichier service-perfdata.tmp ne contient aucun doublon en ce qui concerne les informations remontées
    * par contre la table ods.log contient pour un meme host/moment plusieurs entrées de log (au maximum 2)
    * la table ods.data_bin contient pour un id_metric/ctime, plusieurs entrées (largement plus que 2). Le champs value contient par contre une information pertinente.
    * les fichiers rrd voient sont mis à jour, meme il n'y a que NaN comme valeur.

    Voilà, j'arrive à bout du diagnostic à par en venir à charcuter les scripts perl pour forcer des delete de tuples en doublons dans les tables, mais c'est pas propre du tout.....
    Sysadmin
    OS: Ubuntu / Debian / RHEL
    Nagios env: 1 centreon 2.2.1, 5 Nagios on remote sites, NDOutil v1.4.9
    Own development: status map based on NDO, service status by categories, misc reports on nagios conf, mediawiki linked to centreon and vis-versa

    Comment


    • #3
      normalement y a pas de doublons possible...

      pour la table log : c'est la base de stokage des log dans la DB MySQL.. A ne pas toucher, Y a rien a faire sauf activer le cron parsing_log.pl

      sinon pour les autres tables :

      index_data : repertorie les services a grapher.
      metrics : repertorie les metrics des services
      data_bin : stock les données des metrics des services...

      et si tu as des removes dans les logs, c'est que tu as supprimé des services...

      sinon si tu arrive avoir ca

      Warning : /usr/local/oreon/rrd//xx_y.rrd removed

      dans les log de ods, c'est que t'as du y faire qq choses... y a aucun rapport entre ods et ca

      Quel est le format de ton fichier services perfdata ??
      Julien Mathis
      Centreon Project Leader
      www.merethis.com |

      Comment


      • #4
        Originally posted by julio View Post
        normalement y a pas de doublons possible...

        pour la table log : c'est la base de stokage des log dans la DB MySQL.. A ne pas toucher, Y a rien a faire sauf activer le cron parsing_log.pl
        je comprends bien qu'il ne faut pas y toucher, mais j'ai d'explication sur le fait que dans cette table j'ai des doublons et dans la table de log, j'en ai.

        Originally posted by julio View Post
        et si tu as des removes dans les logs, c'est que tu as supprimé des services...

        sinon si tu arrive avoir ca

        Warning : /usr/local/oreon/rrd//xx_y.rrd removed

        dans les log de ods, c'est que t'as du y faire qq choses... y a aucun rapport entre ods et ca
        Compris, j'ai plus ces messages, par contre j'ai toujours à l'infini le fait de vouloir fair plusieurs rrdupdate, ce qui est logique car les tables ods contiennent des doublons.

        Originally posted by julio View Post
        Quel est le format de ton fichier services perfdata ??
        head -5 perfdata-service.log:

        1178056326 xxxx check_host_alive PING OK - Packet loss = 0%, RTA = 0.15 ms UP
        1178056326 yyyy check_host_alive PING OK - Packet loss = 0%, RTA = 0.18 ms UP
        1178056326 zzzz check_host_alive PING OK - Packet loss = 0%, RTA = 0.16 ms UP
        1178056326 tttt check_host_alive PING OK - Packet loss = 0%, RTA = 0.24 ms UP
        1178056326 uuuu check_host_alive PING OK - Packet loss = 0%, RTA = 0.15 ms UP

        PS: quand j'aurais les explication à ce qui m'arrive, je les mets dans le wiki, j'ai préparé les zones dans la FAQ...
        Sysadmin
        OS: Ubuntu / Debian / RHEL
        Nagios env: 1 centreon 2.2.1, 5 Nagios on remote sites, NDOutil v1.4.9
        Own development: status map based on NDO, service status by categories, misc reports on nagios conf, mediawiki linked to centreon and vis-versa

        Comment


        • #5
          Pour information, le post dans la zone anglais du forum a corrigé mon probleme: passage du heartbeat de 70s à 600s dans les fichiers rrd.
          Par contre à chaque nouveau rrd que ods créé, il faut repasser:

          cd /usr/local/oreon/OreonDataStorage
          for f in *.rrd; do rrdtool tune $f --heartbeat metric:600; done
          Donc toujours autant d'entré dans ods.log au sujet de tentative d'update dans la meme seconde, mais avec le bon heartbeat, les rrd sont mise à jour correctement.

          Les entrées dans ods.log restent pas tres normales mais bon...
          Last edited by clifden; 10 May 2007, 09:53.
          Sysadmin
          OS: Ubuntu / Debian / RHEL
          Nagios env: 1 centreon 2.2.1, 5 Nagios on remote sites, NDOutil v1.4.9
          Own development: status map based on NDO, service status by categories, misc reports on nagios conf, mediawiki linked to centreon and vis-versa

          Comment


          • #6
            Originally posted by clifden View Post
            Pour information, le post dans la zone anglais du forum a corrigé mon probleme: passage du heartbeat de 70s à 600s dans les fichiers rrd.
            Par contre à chaque nouveau rrd que ods créé, il faut repasser:



            Donc toujours autant d'entré dans ods.log au sujet de tentative d'update dans la meme seconde, mais avec le bon heartbeat, les rrd sont mise à jour correctement.

            Les entrées dans ods.log restent pas tres normales mais bon...
            Comment le modifier ds les rrd créé ds /usr/local/oreon/rrd ? (rrd créé par check_graph)

            Comment


            • #7
              Originally posted by Pittocha View Post
              Comment le modifier ds les rrd créé ds /usr/local/oreon/rrd ? (rrd créé par check_graph)
              Avec la commande indiqué, et à relancer à chaque fois qu'un nouevau fichier rrd est créé. C'est de la bidouille, mais j'ai trouvé que ca pour l'instant.
              Sysadmin
              OS: Ubuntu / Debian / RHEL
              Nagios env: 1 centreon 2.2.1, 5 Nagios on remote sites, NDOutil v1.4.9
              Own development: status map based on NDO, service status by categories, misc reports on nagios conf, mediawiki linked to centreon and vis-versa

              Comment


              • #8
                ben non, les fichier rrd de /usr/local/oreon/rrd (créé par check_graph) et ceux de OreonDataStorage n'ont pas la meme syntaxe, donc ca marche pas,
                une idée de comment faire ?

                Comment

                Working...
                X