Announcement

Collapse
No announcement yet.

beaucoup de services = graphs deconnent

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • beaucoup de services = graphs deconnent

    Je crois que le titre résume bien lol !
    Bon , alors mon soucis :

    Dans le cadre d'un stage je m'attaque pour la première foir a snmp avec nagios et centreon.

    Je supervise 21 switchs 3com , des 24 ports et quelques 48 ports , je souhaite monitorer graphiquement le trafique sur toutes les interfaces de tout les switchs,

    et c'est la que ca devient lourd ... autant cela fonctionnait tres bien en testant sur 5 switchs , autant , maintenant que je les monitore tous , les graphs deconnent plein pot , on voit des ptits bout apparaitre les premieres minutes puis ca graphe plus rien ...

    J'ai trituré longement les options du nagios.cfg en lisant des tutos "optimisation de nagios" , en vain !
    Je sais que si les checks sont trop espacés les graphs ont du mal , donc mes services se font avec un intervale de 1 (donc le plus rapidement possible normalement).

    Est-ce vraiment due au nombre de services et leux execution trop espacée ou un probleme de saturation dans le traitement des données de performance ? je ne sais pas trop , et surtout je n'arrive pas a regler le probleme depuis ce debut de semaine !

    a l'aide
    merci d'avance

  • #2
    au cas ou, je rajoute que mes services ont des latences de 60 à 80 secondes, c'est beaucoup ? trop ?

    Comment


    • #3
      C'est beaucoup en effet. Certains post parlent de ce genre de problèmes et des pistes pour améliorer la situation.
      Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

      Comment


      • #4
        Je supervise 90 switchs et je n'ai pas de problème de graphs.
        Supervises-tu tous les ports de tous tes switchs?

        Si c'est le cas tu arrives à combien de services?
        Je penses que si tu en as vraiment beaucoup cela peut venir de ta machine qui n'est pas assez puissante pour traiter toutes les données de performances.
        Conf :
        - RedHat EL 5 -
        - Nagios 2.10 - Nagios plugins 1.4.11 - NDoutils 1.4b7 - Nagvis 1.2b3
        - Centreon 1.4.2.4 - PHP Weathermap 1.2 - Nagios StatusMap 1.1 -

        Comment


        • #5
          en realité j'ai 1200 services , mais dont la moitiée n'a pas de traitement de performances , et qui ne sont verifiées que toutes les 10 min , pour les services importants qui dovent etre relevé frequement et donner des graphs (le traffic des interfaces) j'en ai dans les 600 , et les rrd sont bien mis a jours toutes les 3-4 min grand max ...

          Comment


          • #6
            pour info je tourne sur un athlon 64 3500+ avec 1 Go de ddr , mais j'utilise une ubuntu 32 bits ...

            Comment


            • #7
              C'est vrai que j'ai 2Go de ram et surtout un quadricore donc pas de gros soucis de CPU.
              Essaie de voir la consommation cpu de ton serveur pour voir si c'est à bloc.
              Conf :
              - RedHat EL 5 -
              - Nagios 2.10 - Nagios plugins 1.4.11 - NDoutils 1.4b7 - Nagvis 1.2b3
              - Centreon 1.4.2.4 - PHP Weathermap 1.2 - Nagios StatusMap 1.1 -

              Comment


              • #8
                effectivement le cpu est à bloc !
                J'ai desactivé les 2/3 de mes services pour voir, l'utilisation cpu et ram retombe un peu et mes graphs se font normalement , et surtout la latence des service ne depasse pas 10 secondes !

                Mais est-ce vraiment mon cpu qui sature au point de ne plus traiter les données , ou est-ce l'écart trop important entre les verifications quand il y a beaucoup de services ??? telle est la question !

                Mais que signifie réellement la latence dans centreon ?

                Comment


                • #9
                  pour moi latence c'est le temps de traitement entre l'envoi de la demande et l'affichage du résultat. mais bon je me trompe peut-être
                  DEBIAN etch
                  nagios 2.6
                  centreon 1.2.4.6

                  Comment


                  • #10
                    La latence est la différence de temps moyenne entre le moment où le check doit être fait, et le temps où il a réelement était lancé.
                    Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

                    Comment

                    Working...
                    X