Announcement

Collapse

New version of forum

Hi,

As you can see, the forum has been updated.

We took advantage of this migration to change the theme of the forum and to reorganize sections.

These new sections allow better classify subjects discussed. The old topics have been classified in the "Archives" section of the forum and remains accessible.

We reclassified the recent topics (since the 1st of July) in the news sections. To find your topics, please use search menu. We will reclassify active topics from Archives section to the new ones frequently.

Enjoy reading and discussions
See more
See less

plus de 200 pollers Nagios sous Centreon

Collapse
X
  • Filter
  • Time
  • Show
Clear All
new posts

  • plus de 200 pollers Nagios sous Centreon

    Bonjour,

    C'est dans le titre, je suis actuellement sur un projet dans mon entreprise qui va consister à monitorer plus de 200 sites (lieu).
    Chaque site a des serveur, APwifi, Switches ... à surveiller

    Mes contraintes sont :
    - je passe sur des lignes SDSL, et j'ai besoin d'avoir un monitoring qui ne doit pas être impacté par des coupures sur ces lignes
    J'ai donc besoin d'un serveur monitoring autonome sur place
    - je dois mettre un écran (Nagvis) a disposition sur place (en cas de coupure SDSL, je n'aurais plus d'alertes mail et cette écran peut aider le Helpdesk pour connaître la nature d'un éventuel problème)
    - je peux déployer ces pollers un à un, mais si j'ai besoin de faire une modif sur les fichiers de conf, je dois pouvoir l'envoyer à l'ensemble de mes pollers
    - j'ai besoin de générer des graph lorsque l'on aura besoin d'analyser (évolution de la charge mémoire, CPU, ou autre ...)

    Actuellement j'ai un Serveur Centrale Centreon-Nagios-Nagvis (tout est sur la même machine), et j'ai réussi à déployer des Satellites (poller) avec Nagios et Nagvis sur chaque Satellite.
    Tout est OK, j'envoie les conf de Centreon vers Nagios-Sat (on va l'appeler comme ça .

    Cependant j'ai un doute sur le fait de pouvoir modifier les fichier de conf sur le Nagios-Sat sans passer par Centreon (ça c'est possible) et de voir remonter cette conf dans Centreon (si je ne me trompe pas, si Centreon ne génère pas la conf, il ne la voit pas ?).

    Connaissez-vous une solution qui me permettrait soit :

    - d'envoyer la même conf à plusieurs poller en simultanné, en passant par Centreon
    en créant un groupe de poller par exemple, et je pourrais envoyer la conf à partir de Centreon, dans l'onglet > Configuration > Nagios > Generate et je verrais apparaitre par exemple chacun de mes poller + un groupe de poller ?

    - de modifier mes fichiers de conf simultanément à partir d'un autre moyen (script envoyé au poller), mais que Centreon prendrait en compte et ferait apparaître sur ses écrans ?


    J'ai de gros doutes sur la faisabilité de mon projet, et je sais que certains me proposeraient d'utiliser NRPE ou autre ...
    Mais je dépend trop des lignes SDSL qui peuvent coupées, et des serveurs critiques ne seraient plus monitorés.
    J'ai besoin de permettre aux personnes sur site d'avoir un écran de suivi (type Nagvis et/ou l'interface Web Nagios) et j'ai aussi besoin d'avoir une remonté vers Centreon pour avoir des graph et pour avoir un accès Centralisé aux écran de monitoring par un service Helpdesk par exemple.

    Si vous avez des idées, votre aide est la bienvenue

    (d'ailleurs en rédigeant, je me demande s'il est possible d'avoir autant de poller sous Centreon ?)

    Pour information :
    Version de Centreon 2.1.6
    Version Nagios Centrale 3.0.6
    Version Nagios Sat 3.2.3

    Je dois conserver mon serveur qui fonctionne déjà bien et qui fait actuellement 2200 checks pour 700 hosts.
    Pour une latence qui gravite autour de 0,7 et 8 (quand il y a un certain nombre d'alertes en Warning et Critical, il monte à 8 voir plus parfois, mais ça c'est un autre problème

    Merci d'avance.

  • #2
    Bonjour,

    un début de réponse pourrait venir de Centreon-CLAPI qui est une API en ligne de commande permettant:
    • D'ajouter/modifier/supprimer des objets de la configuration
    • De générer/tester/copier la configuration des pollers
    • De redémarrer les pollers
    Centreon Syslog Module Manager/Developper
    Centreon E2S Module Manager/Developper
    Centreon Enterprise Server (2.x / 3.x) : Centreon Engine 1.3.x / 1.4.x, Centreon Broker 2.6.x / 2.8.x , Centreon 2.x, Centreon-Syslog 1.5.x, Centreon E2S 2.0
    Nagios 3.x et NDOutil 1.x

    Comment


    • #3
      Merci beaucoup, ça me donne une piste où chercher.
      Cela me permettra de cloner mes pollers, mais est-ce que cela me permettra d'envoyer un changement de conf à l'ensemble de mes pollers ?

      Je vais chercher un peu

      Si vous avez d'autres info, je prends !!!!

      Comment


      • #4
        Bonsoir,

        j'ai trouvé ça sur Centreon-CLAPI :
        http://blog.cedrictemple.net/40-cent...mmand-line-api

        Je pense qu'effectivement ça doit pouvoir permettre de faire ce dont j'ai besoin.
        Je vais prendre le temps de bien regarder ça et je ferais un retour ......

        Par contre, le fait que Centreon (et la base NDO) gère plus de 200 pollers (sachant que chaque poller effectuera environ une centainne de tests) peut-il poser problème ?
        Les requêtes effecutés sur la base NDO peuvent-elles impacter mon Nagios Centrale ?

        Il faudrait peut-etre que je prévois de déplacer les Bases de Données Centreon, NDO ... ?


        Encore merci AkHeNaToN pour l'info, ça m'a déjà bien aidé !!
        Last edited by moxxxx; 10th April 2012, 22:09.

        Comment


        • #5
          Hello moxxxx,

          Je te conseil de mettre tes BDD sur un serveur dédié à cela. Tu auras de meilleurs performances.

          Et oui il peut gérer 200 pollers, sachant que tu peux aussi regarder vers notre powerfull NEB, centreon-Broker.

          http://forge.centreon.com/projects/centreon-broker
          Last edited by cjudith; 11th April 2012, 15:38.
          Open Source Monitoring Addict
          OS: Ubuntu / Debian / CentOS / RedHat / Solaris / Arch Linux / Open Suse


          ! NO SUPPORT IN PRIVATE MESSAGE !

          Comment


          • #6
            J'ai un peu entendu parler de Centreon-Broker, mais est-il plus léger que NDO.
            je vois sur certains forum qu'il est conseillé de passer sur Centreon-Broker pour remplacer NDO (c'est bien ça Centreon-Broier peut remplacer NDO ?).

            D'ailleurs, mon Admin réseau s'inquiète de la charge réseau que pourons générer les remontés de mes pollers vers le Centreon (via NDO).

            Avez-vous des notions de cette charge ?
            Remarque : je peux peut-être regarder la tailler du fichier cache NDO2DB (il faut que j'effectue encore quelques tests pour me rendre compte)

            merci encore
            Last edited by moxxxx; 12th April 2012, 23:24.

            Comment


            • #7
              Les contraintes ont un peu changé.
              L'admin ne souhaite plus que les Nagios-Sat effectuent leur remonté vers Centreon-centrale.
              Il me propose donc d'installer la solution complète Centreon-Nagios-Nagvis sur chaque sat.

              Effectivement ça peut me simplifier la vie pour avoir les graph de RRD et les maps de Nagvis.
              Par contre il me reste la problématique de générer la conf de mes Sat en simultanné depuis un Serveur Centrale.

              Quoi que ... Peut-etre qu'avec Centreon-CLAPI peut m'aider à ça ?
              Si un script centrale appel les commandes de CLAPI sur les pollers !!

              A voir ...

              Comment


              • #8
                Avec 200 sites à surveiller, on ne peut pas "bricoler"... Ta configuration doit impérativement être centralisée, sinon ce n'est pas maintenable, ni exploitable !
                L'architecture répartie est suffisamment robuste (au moins avec NDO, je n'ai pas encore d'expérience avec le broker centreon) pour répondre à ton besoin.
                Avec une centaine de surveillance par site, le flux réseau sera minime.
                Fait utiliser le petit outil Nagstamon sur les sites pour consulter les alarmes. Ainsi, en cas de coupure réseau, on peut continuer à travailler (nagstamon interrogera directement le nagios local). Et comme le disait cjudith, la contention sera sur la base de données centrale. Place la sur un serveur ayant de très bons accès disques et bien dimensionné en mémoire.
                Valide dans un premier temps ton archi sur avec qlq sites (et le tout sur des VMs identiques).
                Centreon 2.3.9 - Nagios 3.3.1 - 1800 hosts - 7000 services - 15 pollers avec NDO.

                Comment


                • #9
                  Jetel, je comprends tout a fait ton point de vue, j'essaie au maximum de ne pas faire du "bricolage" ;-)
                  D'aileurs je ne pense pas que les remontés d'info d'un Poller vers le Centrale, génère beaucoup de de traffic, mais mon admin ne veut pas revenir là-dessus : il ne veut pas de flux généré par mes serveurs sur les lignes SDSL (il est vrai qu'elle vont être pas mal sollicité par d'autres services de production).
                  J'avais aussi pensé à Nagstamon, ic'est une bon outils. J'ai Nagios-Checker (Plugins Firefox) sur mon PC pour le serveur Centrale et c'est très pratique.

                  Mais la solution Centreon-CLAPI à l'air de répondre à mes besoins, je suis d'ailleurs parti dans cette direction pour la mise en place de mes Satellites.
                  Il est vrai que les info ne seront pas centralisées, mais dans mon cas, ce n'est pas génant.
                  Les points importants dans mon cas sont :
                  - Serveur autonome sur chaque site
                  - alerting (mail et nagvis)
                  - graph si besoin de diagnostique
                  - et export de conf à grande échelle (déploiement + ajout +modification)

                  Par contre je rencontre des petites difficultés concernant Centreon-CLAPI

                  il me génère sans problème la config sur Centreon, avec cette commande par exemple :
                  ./centreon -u nagiosadmin -p nagiosadmin -o HOST -a ADD -v "voila;voila;voila.fr;generic-host;central;Linux-Servers"

                  Je peux aussi lister les pollers (plutôt le poller)
                  [root@monitor-test core]# ./centreon -u nagiosadmin -p nagiosadmin -a POLLERLIST
                  1 Central


                  Par contre ça bloque si je veux générer la conf de Nagios depuis le Centreon et redémarrer Nagios pour prise en compte de la nouvelle conf :
                  ./centreon -u nagiosadmin -p nagiosadmin -a POLLERGENERATE -v 1

                  J'ai ce résultats (j'ai cette ligne environ 20 fois, sauf les 2 dernières lignes):
                  PHP Warning: date(): It is not safe to rely on the system's timezone settings. You are *required* to use the date.timezone setting or the date_default_timezone_set() function. In case you used any of those methods and you are still getting this warning, you most likely misspelled the timezone identifier. We selected 'Europe/Berlin' for 'CEST/2.0/DST' instead in /opt/centreon/www/include/configuration/configGenerate/DB-Func.php on line 496
                  Configuration files generated for poller 1

                  Return code end : 0

                  Le redémarrage de Nagios fonctionne
                  ./centreon -u nagiosadma POLLERRESTART -v 1
                  Starting nagios: done.Return code end : 0


                  J'ai cherché un pau, mais je ne voit pas ce que cela signifie (enfin je vois bien qu'il ya un problème avec le fichier DB-Func.php, mais quel problème ?).
                  je n'ai pas pris le temps de ragrder les logs de Nagios, Centcore et Censtorage pour voir si j'ai d'autres info....

                  Mais si ça parle à quelqu'un, je veux bien un coup de main

                  Je continue mes tests et vous tiens informé.

                  Merci.
                  Last edited by moxxxx; 24th April 2012, 18:56.

                  Comment


                  • #10
                    Pour résoudre le problème du warning php il te suffit de configurer le paramètre date.timezone dans le php.ini.

                    Comment


                    • #11
                      Merci pour ta réponse, je vais regarder ça.
                      Je n'avais pas mis à jour le post, mais je me suis aperçu que malgrès cette alerte, la commande fonctionne correctement.

                      Et j'ai vu avec un collègue qu'une alerte WARNING en PHP n'était pas critique et qu'elle n'empêche pas le fonctionnement de la commande mais alerte simplement (dans mon cas c'est ça, il y a un problème avec le timezone, mais ça n'empêche pas le fonctionnement de la commande).

                      Dès que j'aurais bien utilisé Centreon-CLAPI, je ferais un p'tit retour dessus.


                      Merci encore

                      Comment


                      • #12
                        Bonjour moxxxx,

                        Je ne sais pas si tu as vu mais il y a une nouvelle version de Centreon-CLAPI qui permet de faire plus d'actions que la version précédente. ;-)

                        Have fun !
                        Open Source Monitoring Addict
                        OS: Ubuntu / Debian / CentOS / RedHat / Solaris / Arch Linux / Open Suse


                        ! NO SUPPORT IN PRIVATE MESSAGE !

                        Comment


                        • #13
                          @cjudith : Merci pour l'info.
                          Mais Centreon est maintenant en Prod, la version de Centreon-CLAPI me convient parfaitement pour ce que j'ai besoin de faire.
                          je ne voudrais pas que la mise à jour vienne casser mon Centreon :???:.
                          J'irais quand même jeter un oeil aux nouvelles fonctionnalité de cette MAJ, on ne sait jamais, il y en a peut-être qui m'intérressaraient !

                          Petit retour sur Experience :
                          Mon projet est maintenant en production.
                          Je n'ai pour l'instant qu'une 10aine de Nagios Satellites, ça fonctionne bien.
                          Toutes les remontés d'info se font bien sauf (les graph sur centreon se dessinent bien).
                          Et chaque site dispose d'une map sur Nagvis, ce qui plait aux utilisateurs (Le fait de voir que leur site est sous surveillance et d'avoir accès à cette surveillance)

                          Il n'y a que l'historique des logs que je n'arrivent pas à faire remonter sur Centreon.
                          Mais ce n'est pas très gênant sachant que je peux aller récupérer ces logs sur chaque Nagios-Satellite.

                          Sinon, concernant Centreon-CLAPI :
                          super module qui permet d'ajouter des Hosts ou Services facilement en ligne de commande.
                          Un collègue m'a donc développer un script qui me permet d'intégrer rapidement et facilement une nouvelle configuration dès qu'un nouveau Nagios est à mettre en place.

                          J'ai aussi rencontré quelques problèmes avec Mysql, qui n'acceptait plus de nouvelle connexion.
                          Vu avec mon admin système, il manquait des informations dans le fichier de conf Mysql.


                          Merci
                          Last edited by moxxxx; 14th January 2013, 13:56.

                          Comment


                          • #14
                            Une petite idée sur le fait que mes logs ne remonte pas dans Centreon ?

                            J'ai regarder dans nagios.log (sur les serveur satelite), il n'y a aucun message d'erreur.

                            Sur le serveur Centreon :
                            > dans centcore.log
                            14/1/2013 21:25:32 - Cannot get log file or log file doesn't exists on poller 5
                            Mais il s'agit d'un poller qui est actuellement arrété.

                            > dans centstorage.log
                            15/1/2013 21:51:11 - ERROR while updating /opt/centreon/var/metrics/1025.rrd at 1358283035 -> 43 : /opt/centreon/var/metrics/1025.rrd: illegal attempt to update using time 1358283035 when last update time is 1358283035 (minimum one second step)
                            Mais il s'agit plus d'un problème lié à RRDtools plutot qu'aux logs.

                            En revanche, j'ai les logs du serveur Nagios-principal (celui hébergé sur le même serveur que Centreon).

                            Je ne sais pas trop quels fichiers de logs regarder ? ou des droits à vérifier ? ou peut-être la conf Centreon-Nagios ??
                            Je vais me re-dérouller la proc voir si je n'ai pas oublier quelque chose ...

                            Merci
                            Last edited by moxxxx; 15th January 2013, 21:58.

                            Comment

                            Working...
                            X