Announcement

Collapse
No announcement yet.

Charge CPU et Load average élevée

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Charge CPU et Load average élevée

    Bonjour,

    J'ai besoin de quelques avis, mon Centreon tourne depuis un bon mois et j'ai remarquer que la charge CPU à augmenter au fur et a mesure de mes rajouts de services.
    Centreon/Nagios/MySql se trouvent sur une VM Esxi avec 1 vCPU.

    Voici un graphique de la charge CPU
    http://imagik.fr/view-rl/295257


    Voici le graphique du Load average
    http://imagik.fr/view-rl/295258

    Auriez-vous des conseils a me donner pour réduire la charge de mon système ?

    Merci.

  • #2
    Combien de services et combien d'hôtes ?

    Quel type de contrôle: SSH, NRPE, NSCLient++, Base de données, autres ?

    Caractéristiques de l'OS, mémoire, fréquence CPU, ..

    Faut être un peut plus bavard sinon ca va être difficil de voir si cette charge est "normal" ou non.

    PS: sujet traiter des centaines de fois, exit les VM. A caractéristiques égales avec une machine physique, une VM est toujours moins performante.
    Centreon Syslog Module Manager/Developper
    Centreon E2S Module Manager/Developper
    Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
    Nagios 3.x et NDOutil 1.x

    Comment


    • #3
      Oui j'ai lu quelques sujets sur ce problème... Mais aucun ne m'a apporter une solution, donc je me suis permit d'ouvrir un sujet pour mon propre problème.

      En ce qui concerne la VM, j'ai bien compris que c'est pas l'idéal, cependant je n'ai pas le choix pour le moment...

      Nb de services: 260
      Nb d'hôtes: 30

      Qu'entend tu par "Quel type de contrôle" ?

      Je suis sous Ubuntu 10.0.4 avec 800Mo de mémoire vive et un processeur dCore 2 duo à 2.33Ghz
      Centreon 2.1.8 et Nagios 3.2.1

      Ci joint le % ready
      http://imagik.fr/view-rl/295279

      Comment


      • #4
        Originally posted by toni75 View Post
        Qu'entend tu par "Quel type de contrôle" ?
        quelle type de contrôles:
        • tu contrôle tes linux par SNMP, NRPE, "check_by_ssh" ?
        • tu contrôle tes windows par SNMP, NSclient++ ?
        • contrôle tu des ESX via SNMP, des plugins Perl utilisant l'AIP vShere ?
        • control tu des bases de données MSSQL, Oracle, Postgre, ... ?
        • As tu des contrôles exotiques ?


        Ceci afin de savoir si cette charge est normal.

        De plus, quelle est le temps de contrôle ("Check Execution Time") min, max et moyen des contrôles de services (Dans Centreon, menu "Home -> Nagios Statistics -> Performance Info" ?
        Centreon Syslog Module Manager/Developper
        Centreon E2S Module Manager/Developper
        Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
        Nagios 3.x et NDOutil 1.x

        Comment


        • #5
          Merci de ta réponse.

          Pour mes contrôles je fais essentiellement du SNMP sur du Linux et switchs/routeurs.

          Voici la totalité des infos de performance:
          http://imagik.fr/view-rl/295333
          Last edited by toni75; 8 September 2010, 16:39.

          Comment


          • #6
            Bonjour,

            J'ai un détails qui a son importance et que j'ai oublier de vous dire.

            Je check 191 services sur 24 switchs avec la commande check_centreon_snmp_traffic
            Le détails qui a son importance est que le Normal Check Interval est défini a 1. C'est un besoin que nous avons d'avoir cette granularité d'une minute sur les graphiques des Switchs.

            Pour tester j'ai désactiver tous les Switchs et voilà ce que me donne les graphs Cacti.

            CPU LOAD
            http://imagik.fr/view-rl/295755

            LOAD AVERAGE
            http://imagik.fr/view-rl/295756

            Comment puis-je grapher mes Switchs avec une granularité d'une minute sans impacter les performances de ma machine. J'aurais besoin de conseils.

            Merci à vous.
            Last edited by toni75; 9 September 2010, 11:08.

            Comment


            • #7
              Passer par un plugin plus performant en C/C++ par exemple mais je ne pense pas que le changement sera drastique.
              Ton plugin est en perl, as-tu bien compilé nagios avec le support de l'embedded perl (ce qui devrait accélérer le temps d’exécution/de chargement du plugin) ?
              Sinon, il faut délester ton nagios et passer à une supervision distribué.
              Tester éventuellement des paramètres d'optimisation/de tuning de nagios et de mysql mais là je n'y connais rien.

              Si tu cherches sur le forum, tu trouveras des tas d'exemple de mec qui essai de faire du RealTimeMonitoring avec Nagios ce qui à mon sens est un peu débile car une fois l'incident remonté en moins d'une minute, l'incident va mettre combien de temps à être réglé ????
              Intel(R) Xeon(TM) CPU 3.4GHz - MemTotal : 1034476 kB
              Centreon 2.4.1 - Nagios 3.2.1 - Nagios Plugins 1.4.15 - Manubulon Plugins tuné
              Fedora Core 5 - 2.6.20-1.2320

              Comment


              • #8
                Les latences semblent bonnes, donc pour l'instant ça va.

                Par contre le %ready n'est pas sur l'image. Va plutôt direct en ssh et lance esxtop, tu gagneras du temps pour avoir toutes les infos plutôt que la console qui ne montre que les indicateurs les moins importants.

                Mais bon snmp+checks toutes les minutes là oui forcément ça va charger, il n'y a pas de miracle. On peut atténuer avec les options de tuning, mais comme le dit DonKiShoot si c'est pour du temps réel ce n'est pas le bon outil pour le faire, si tant est que l'on considère que faire du temps réel à un sens en matière de supervision.
                Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

                Comment

                Working...
                X