Announcement

Collapse
No announcement yet.

[Résolu] Redémarrage des hosts

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • [Résolu] Redémarrage des hosts

    Voila j'ai un tout petit problème : certains de mes hosts redémarrent périodiquement (la nuit ou le week end). Le problème c'est que dès qu'un host n'est plus pingable (il est en train de redémarrer) il n'est plus jamais repingé (désolé pour le franglais :wink et il reste à "host unreachable". J'avais résolu le problème en mettant le retain_status_information à no mais ça oblige à redémarrer nagios/oreon tous les jours (vu qu'un des serveurs redémarre tous les jours) et ça m'empêche de faire des statistiques vu que je n'ai que les données du jour... Comment faire pour que les machines continuent à être pingées même si elles n'ont plus répondu à un moment ? (à part en faisant une plage horaire spéciale)

  • #2
    Bonjour,

    Heu... normalement, le serveur est pingué de manière régulière. Il n'est pas sensé s'arrêter de le vérifier juste parce que le serveur est tombé. Je l'ai encore vérifier cette semaine, ça marche.

    Comment


    • #3
      ben oui mais je viens de refaire un test et chez moi il s'arrête de le pinger quand il a passé son max_check_attempts sans qu'il ait eu une réponse...

      Comment


      • #4
        Bonjour,

        Ce n'est pas ce que dit la documentation http://nagios.sourceforge.net/docs/1...lem_scheduling

        Comment


        • #5
          Oui je vois bien... seulement ça ne marche pas chez moi :/ si j'ai bien tout compris :
          en temps normal mon service est marqué ok. Lorsque le serveur redémarre par exemple, nagios va alors se rendre compte que le service n'est plus ok, va vérifier l'host et se rendre compte qu'il n'est plus ok (puisqu'en train de redémarrer). Il va me le marquer down (et c'est ce qu'il faut faire). Sauf q'une fois le serveur en route, le service est ok et devrait être marqué comme tel, sauf que ce n'est pas le cas... Et le serveur reste marqué down jusqu'au redémarrage de nagios (parce que j'ai enlevé le retain_status_information, sinon il restait down en permanence).
          Ca viendrait du côté du service peut-être à ce moment là. Je vais regarder là dedans s'il n'y a pas des choses à modifier.

          Comment


          • #6
            Dis moi ton service est vérifié une seule fois par jour? Quel est ton intervalle entre 2 tests pour ton service?

            Comment


            • #7
              C'est un service de test qui fait un check_graph_ping toutes les 2 minutes avec un retry de 2 minutes aussi. Je viens d'ajouter un check_freshness ça m'a l'air bien en rapport avec mon problème, on va voir ce que ça donne.

              Comment


              • #8
                Ca a l'air de fonctionner ^^ je refais quelques tests pour voir.



                [edit]
                C'est bon ça marche. C'est un peu bidouille, mais ça marche.
                J'ai ajouté un check_freshness avec une durée de mon temps entre les check + 1/2 fois le temps du retry et c'est bon.
                Merci pour m'avoir répondu templuche

                Comment

                Working...
                X