Announcement

Collapse
No announcement yet.

Problème Schedule

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Problème Schedule

    Bonjour à tous,


    Voila mon problème, problème visible sous les configuration suivantes :
    nagios 3.0.5 / nagios 3.1
    centreon 2.0 , centreon 2.1

    Problème rencontré uniquement avec des contrôles de hosts et de services qui sont contrôler sur des plages horaire spécifique (autre que 24x7)

    Mon scheduleur durant un moment de mise en exploitation par complètement en vrille :
    Tous les controles ayant des times period différent de 24x7 perde un jour dans la date du dernier controle et gagne 1 anné dans la date du futur controle. ce qui amène ce jour pour un controle effetcué ce matin à 9H pour la derniere foi un last check hier à 18:31:42 et le prochaine controle le 20-03-2010 08:39:58 .
    A noter que ce "bug" aparait dans les plages active de controle ou dans les plages non active de controle.

    Je suis en RHEL5.2 avec une machine en Vmware.

    Je vous met en plus un exmple de controle :

    define service{
    host_name TEST
    service_description service_crontab_conf_test
    use generic-service_time
    servicegroups Services
    check_command check_centreon_process_use!crond
    }
    define service{
    name generic-service_time
    service_description generic-service_spetime
    max_check_attempts 3
    normal_check_interval 10
    retry_check_interval 5
    check_period 8h30-19hx5
    notification_interval 30
    notification_period 24x7
    notification_options w,c,r
    notifications_enabled 1
    contact_groups PROD
    register 0
    }
    define timeperiod{
    timeperiod_name 8h30-19hx5
    alias 8h30-19hx5
    monday 08:30-19:00
    tuesday 08:30-19:00
    wednesday 08:30-19:00
    thursday 08:30-19:00
    friday 08:30-19:00
    }


    Pour que le calcul soit bon je suis obliger de rechekcker tous les services et hote à la main et le calcul se refait normalement jusqu'a la prochaine panne ....

    Merci de votre aide
    RHEL 5.8 , Centreon 2.5

  • #2
    Attention big nagios

    Bonjour à tous.
    Je tiens à relancer sur mon sujet.

    Pour les personnes utilisant les times_period pour les contrôles, ayant installé nagios sur Vmware, un enorme Bug entraine des problème dans les calcul de controle.

    exemple : un controle futur passe de j+1 à j+1 + 1 ans .....
    autre exemple : un futur controle se passera à une date antérieure ....

    De ce que j'ai pu comprendre, un synchronisation de la machine virtuel sur la machine physique entraine un problème de calcul dans les controles de nagios.

    Pour le moment je n'ai pas trouvé de solution mais cela est TRES CRITIQUE
    voir les sujet suivant :
    http://forums.bfl-solutions.eu/viewt...highlight=2010
    http://article.gmane.org/gmane.netwo...atch=next+year
    http://www.mail-archive.com/nagios-u.../msg24928.html

    Je toruve cela incroyable que cette information soit si dure à trouver pour un bug aussi important

    NB : version concernée : 3.X de nagios
    RHEL 5.8 , Centreon 2.5

    Comment


    • #3
      VM sur ESX?
      Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

      Comment


      • #4
        Pour moi serveur ESX
        RHEL 5.8 , Centreon 2.5

        Comment


        • #5
          Regardes si ton ESX n'est pas surchargé. Dans le cas des ESX, soit:
          *tu as trop de VM,
          *tu as trop de CPU virtuels sur ta machine.
          Parfois les deux.

          Tu as mis combien de CPU virtuels? 1 c'est bien 2 ca passe encore, 4 c'est les problèmes assurés sur ESX (même dédiés).

          Si tu en as 1 ou 2, regarde le %ready avec esxtop sur ton esx, si tu vois la valeur régulièrement au dessus de 10%, c'ets que ton hôte est trop chargé, donc il faut enlever des VM.
          Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

          Comment


          • #6
            Je suis loin d'etre surcharger sur le hosts ....
            En revanche je suis la piste des 4 CPU, je viens de passer à 2 pour suivre un peu le changement.
            Je reviens pour vous tenir au courant
            RHEL 5.8 , Centreon 2.5

            Comment


            • #7
              Attention, on pense toujours être non chargé sur le hôte. Par exemple, c'est ce que je pensais sur un esx avec 10% de CPU utilisé. Et bien si on regardait le %ready, les VM n'avait pas les CPU à temps, donc perte de temps système, et là gros pb derrière... bref, ne pas trop faire confiance à l'indicateur CPU sur esx.
              Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

              Comment


              • #8
                De retour, toujours le même problème....
                je suis le seul dans ce cas ????

                J'ai suivi tout de même un petit patch pour le check.c de nagios afin de mieu interpréter des timeperiod. Cela à fonctionné pendant deux jours mias aujourd'hui retour à la case départ sur le controle de hosts ayant une time-period différente de 24h/7j

                Pour information :
                J'ai tout de même tester de passer en nagios 3.1 qui est en Dev et d'après la roadmap corrige un problème de timeriode, je cite :
                "Fix for bug in timeperiod calculation of year/month rollovers and display of fixed calendar dates in web interface "

                Mais toujours le même problème...
                RHEL 5.8 , Centreon 2.5

                Comment


                • #9
                  Voila une information très importante

                  Suite à mon problème que je traine depuis plus de 2 mois sans aucune réponse, je viens de trouver cet article.

                  Faite vraiment tous attention à votre scheduleur surtout si vous travailler sur un environnement de production

                  http://cedrictemple.net/dotclear/ind...nceur-Nagios-3

                  Je ne veux pas bloquer tout utilisateur de nagios 3 / centreon mais je pense franchement qu'on se retrouve tous avec un outil actuellement instable, un outil nous permettant de contrôler l'instabilité des systèmes .....
                  RHEL 5.8 , Centreon 2.5

                  Comment

                  Working...
                  X