Announcement

Collapse
No announcement yet.

Problème avec le Downtime

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Problème avec le Downtime

    Bonjour à tous,

    j'ai constaté un bug au niveau du downtime sur un host (pas systématique):

    après avoir scheduler un downtime sur centreon il me cré deux entré pour le même host (donc doublon) ce qui quand je regarde mon host normalement en downtime ne l'est pas.

    Si je cré une troisième entrée (doublon sur trois entrées) alors le downtime s'active.

    Si quelqu'un à déja eu un problème similaire ? l'as t'il resolu ? d'ou cela provient (pb réseau, pb serveur web ou php , etc...)?

    au fait ma version de centreon est la : 2.1.4

    Merci d'avance.
    dark_latino
    Member
    Last edited by dark_latino; 13 January 2010, 09:59.
    Centreon user
    App: Nagios 3.3.1 / NDO 1.4b7 patch SVN / Centreon 2.2.2
    OS: RedHAT / CentOS / Ubuntu

  • #2
    Lorsque que tu créé un downtime, est t'il fixe ?

    Lorsque tu valide, regarde en même temps dans le fichier nagios.log pour voir si la commande externe passe une ou deux fois:
    Code:
    tail -f /usr/local/nagios/var/nagios.log
    Centreon Syslog Module Manager/Developper
    Centreon E2S Module Manager/Developper
    Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
    Nagios 3.x et NDOutil 1.x

    Comment


    • #3
      OK merci AkHeNaToN,

      alors si je cré un downtime, j'ai bien une seule entrée mais si par erreur je remet un downtime sur cet host il me met plusieurs downtime en doublons :
      cela varie si c'est un chiffre pair donc 2 ou 4 doublons le downtime semble desactive dans l'interface centreon mais pas dans le fichier de log sinon 3 ou 5 doublons le downtime parait actif sur l'interface est dans le fichier de logs)

      a l'heure actuelle mon bac d'alerte est faible j'ai l'impression qu'il cré également beaucoup de doublons quand nous avons énormément d'alertes.

      Pour info on utilise des pollers situés sur différents sites mais les alertes remontes toutes sur un poller central.

      Je me retrouve avec plusieurs nagios.log (même nombre que de pollers),
      Pourtant je vois bien que la commande passe dans le nagios.log du poller ou l'host se situe. Il n'y a pas d'incohérence du type :
      le système cré autant de downtime de cet host par rapport au nombre de poller.

      donc je ne vois pas d'ou provient ce problème.

      Si une bonne âme pourrait faire le test mettre un downtime sur un host puis en remettre un sur le même voir si il reproduise la même erreur que moi.

      Pour info nous avons plusieurs equipes dans mon entreprise admin, pilote, etc... les downtime sont géré principalement par les pilotes nous les informons sur quel host ou quel check il faut les mettre. le problème quand il y a beaucoup d'alertes les statuts mettent du temps à s'actualisé et cela arrive qu'ils acquittent plusieurs fois un même service (la aucun problème) par contre pour les downtime on a le problème si doublons. les erreurs sont courantes lorsque le Bac d'alertes est importants.

      Merci d'avance.
      Centreon user
      App: Nagios 3.3.1 / NDO 1.4b7 patch SVN / Centreon 2.2.2
      OS: RedHAT / CentOS / Ubuntu

      Comment


      • #4
        S'il y a problème, cela proviendra surement de Nagios.

        Centreon ne fait qu'envoyer une commande externe à Nagios et c'est ce dernier qui l'interprète. De plus, pour l'affichage dans Centreon, les données proviennent de la base ndo (ou centstatus) qui est alimenté par Nagios.

        Je vais faire un test et je te tiens au courant.
        Centreon Syslog Module Manager/Developper
        Centreon E2S Module Manager/Developper
        Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
        Nagios 3.x et NDOutil 1.x

        Comment


        • #5
          Bon test effectué et même problème:

          Si deux pages de descriptions d'un hôte sont ouvertes et que deux personnes "prennent en compte" l'hôte, alors le deuxième annule le premier.

          Normalement, sur une même fenêtre, après avoir "pris en compte" un hôte, Centreon propose la suppression de la prise en compte. Mais sur deux fenêtre séparée, il est impossible d'obtenir se comportement.
          Centreon Syslog Module Manager/Developper
          Centreon E2S Module Manager/Developper
          Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
          Nagios 3.x et NDOutil 1.x

          Comment


          • #6
            Ce qui est bizard c'est que Nagios garde quand même en mémoire la prise en compte. C'est dans la base ndo que l'info à disparue et par conséquent non visible dans Centreon.
            Centreon Syslog Module Manager/Developper
            Centreon E2S Module Manager/Developper
            Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
            Nagios 3.x et NDOutil 1.x

            Comment


            • #7
              Pour infos on a à l'heure actuelle environ 500 hosts et 6400 services checkés
              on monitore des serveurs Windows/unix/linux sur HP servers AIX server Sun Server ou VM, des ESX des baies SAN des clusters , routeur etc..

              l'environnement en terme de host et de services va augmenter sensiblement intégration de check sur ordonnanceurs (control-m) suivi des sauvegardes (Netbackup) puis l'ajout d'une multitude de serveurs pas encore supervisé par centreon (au final nous approcherons 1000-1500 hosts et plus ou moins 15000-18000 services a checkés peut être plus, équipements réseaux carte ILO/ALOM avenir pour l'intégralité des serveurs.

              Peut être que le problème provient de la multitude de checks effectués et que la base NDO a du mal (même si pour le reste.

              La commande est bien interprété, je suis d'accord mais pourquoi la fait il apparaitre plusieurs fois dans le nagios.log, par ailleurs on voit bien le downtime s'enlever une fois la date de fin du schedule passé. la base NDO serait donc perturbé par ces doublons et effacerait l'entrée dans centreon.
              N'est t'il pas possible d'interdire les doublons à la table gérant les downtime (cela doit être possible avec une base mysql)?

              Le problème est facilement contournable en allant checkés a la mano les downtime et d'en supprimer tous les doublons mais les equipes de pilotage ont des contraintes sur du matériel ou applications critique ils ont 3 minutes pour détecter un incident et traiter (escalade) de la des stats sont émises donc quand nous les prevenons pour qu'ils placent un downtime si ils ne vérifient pas les stats seront faussés car pas pris en charge en 3 minutes et si ils vérifient souvent les trois minutes sont dépassés.

              donc en attendant on fait cela comme ça mais si on peut résoudre ça serait plus simple pour eux.

              Merci d'avance
              Centreon user
              App: Nagios 3.3.1 / NDO 1.4b7 patch SVN / Centreon 2.2.2
              OS: RedHAT / CentOS / Ubuntu

              Comment


              • #8
                Le problème ne vient pas du nombre d'hôte car avec un seul je reproduit le problème.

                Dans nagios.log il l'a fait apparaitre autant de fois que de personne l'on envoyé avec Centreon ce qui est normal comme comportement. Le problème dans Centreon (2.1.4) est que pour un hôte downtime, le champ "is schedule downtime?" est vide. Cela est un bug qui sera corrigé.

                Mais pour Nagios, qu'il recoivent une ou 5 entrée pour le même hôte, apparement, il programme quand même le downtime correctement.

                C'est juste qu'il y aura plusieurs ligne de commentaires dans Centreon du ou multiple entrée dans la base MySQL.
                Centreon Syslog Module Manager/Developper
                Centreon E2S Module Manager/Developper
                Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
                Nagios 3.x et NDOutil 1.x

                Comment


                • #9
                  OK donc pour le moment on est en stand by attendre une nouvelle version de centreon avec peut être 'integration de Centreon-Broker'.

                  bon en tout cas merci pour ces infos, et aussi d'avoir reproduit le souci sa fait plaisir de ne pas être tous seul face a un problème.

                  @++++

                  PS : Aux modérateurs peut être laissé le post ouvert en attendant une résolution future.
                  Centreon user
                  App: Nagios 3.3.1 / NDO 1.4b7 patch SVN / Centreon 2.2.2
                  OS: RedHAT / CentOS / Ubuntu

                  Comment


                  • #10
                    Originally posted by AkHeNaToN View Post
                    Cela est un bug qui sera corrigé.
                    Y'a un bug qui a été ouvert sur la forge ? je ne l'ai pas trouvé .

                    Comment


                    • #11
                      Logiquement devrait être corrigé avec l'arrivée du centreon-broker qui remplacera NDO.

                      http://forge.centreon.com/projects/show/centreon-broker
                      Centreon user
                      App: Nagios 3.3.1 / NDO 1.4b7 patch SVN / Centreon 2.2.2
                      OS: RedHAT / CentOS / Ubuntu

                      Comment

                      Working...
                      X