Announcement

Collapse
No announcement yet.

Demande de conseils

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Demande de conseils

    Bonjour à tous,

    J’ai actuellement un projet à réaliser et j’aurais besoin de quelques conseils. Voilà, nous avons actuellement une plateforme de supervision qui check 130 hosts et 434 services associés (Oreon + Nagios). Nous disposons actuellement de 2 nouveaux serveurs et l’idée serait d’avoir 2 machines qui check par exemple 200 services et pareil pour la 2ème, et d’avoir une 3ème machine qui affiche les résultats des checks (Supervision Répartie il me semble). Ceci est possible avec NSCA si je ne me trompe pas. Mes questions seraient :

    - Faut-il installer Oreon sur chacune des machines ?
    - Comment se passe l’ajout des hosts ? Juste sur la machine « Web » (Celle qui affichera les resultats) ?
    - Y’a-t-il quelque chose de spécifique à ne pas oublier ?
    - Pourriez vous me donner quelques conseils ou indications ?

    Et dernière question : Est-ce possible ?

    En vous remerciant d’avance et bonne continuation à l’équipe et leur très bon travail.

    Erwan

  • #2
    question:
    qu'est ce qui vous pousse à vouloir répartir les services sur plusieurs machines dans un premier lieu ?

    Comment


    • #3
      La machine que l'on a actuellement commence à se faire vieille, de plus la fréquence des checks est élevée (toutes les 2 mins max).

      Comment


      • #4
        Re: Demande de conseils

        Originally posted by Erwan
        Bonjour à tous,

        J’ai actuellement un projet à réaliser et j’aurais besoin de quelques conseils. Voilà, nous avons actuellement une plateforme de supervision qui check 130 hosts et 434 services associés (Oreon + Nagios). Nous disposons actuellement de 2 nouveaux serveurs et l’idée serait d’avoir 2 machines qui check par exemple 200 services et pareil pour la 2ème, et d’avoir une 3ème machine qui affiche les résultats des checks (Supervision Répartie il me semble). Ceci est possible avec NSCA si je ne me trompe pas. Mes questions seraient :

        - Faut-il installer Oreon sur chacune des machines ?
        - Comment se passe l’ajout des hosts ? Juste sur la machine « Web » (Celle qui affichera les resultats) ?
        - Y’a-t-il quelque chose de spécifique à ne pas oublier ?
        - Pourriez vous me donner quelques conseils ou indications ?

        Et dernière question : Est-ce possible ?
        D'un point de vue Nagios pur, tout ceci est possible MAIS la troisième machine doit absolument disposer des mêmes définitions d'hôtes et de services que les deux premières réunies. Par contre, ces deux-là n'ont pas besoin d'avoir de contacts définis et cet aspect (la notification d'alerte) peut être ou non dévolu à la troisième.
        Oreon a été initialement conçu pour gérer un et un seul Nagios, ce qui voudrait dire qu'il faudrait donc disposer d'un Oreon sur chaque machine afin de pouvoir ajouter les différents hôtes et services mais tu noteras que cette tâche risque d'être bien rébarbative... La gestion centralisée, nommée Centreon, fait néanmoins partie de la roadmap du projet. Pour la petite histoire, le nom vient d'un projet d'un stagiaire qui a réalisé une maquette sur le sujet.
        Pour ton problème, la première chose à considérer est de savoir quels seront les rôles définis pour chacune des machines (notification, check, etc.) et d'en déduire les besoins en synchronisation.
        Comme alternative à NSCA, il serait également possible de passer par des interruptions SNMP (à l'aide des MIBs officielles du projet Nagios et d'un plugin de notification à écrire...). En effet, NSCA peut souffrir de problèmes de performance (il est d'ailleurs conseillé de l'utiliser en stand-alone plutôt que via inetd). Et puis on est fana de SNMP ou on ne l'est pas ;-)

        UPDATE: dernier point que j'oubliais : Perfparse. Il existe un mode démon pour cet outil qui serait très utile dans une telle architecture. Le démon perfparsed[1] serait installé sur la troisième machine, et sur les deux autres seulement des clients[2] configurés pour envoyer les données directement au serveur, via TCP.

        [1]: http://perfparse.sourceforge.net/docs.php#AEN167
        [2]: http://perfparse.sourceforge.net/docs.php#AEN188
        Raphaël 'SurcouF' Bordet
        Je ne teste pas mes plugins en root, tu ne testes pas tes plugins en root...
        Dons Paypal

        Comment


        • #5
          Originally posted by Erwan
          La machine que l'on a actuellement commence à se faire vieille, de plus la fréquence des checks est élevée (toutes les 2 mins max).
          Pense à bien utiliser de préférence des plugins écrits en C ou en Perl (et en activant l'interpréteur embarqué ainsi que le cache) : ça devrait limiter les chutes de performances. Et cela ne se limite pas, à mons sens, qu'aux plugins mais aussi aux scripts de notifications, de perfdata, etc..
          Raphaël 'SurcouF' Bordet
          Je ne teste pas mes plugins en root, tu ne testes pas tes plugins en root...
          Dons Paypal

          Comment


          • #6
            oula ! vous vous compliquez la vie, là

            si c'est un projet de production et non pas de recherche, je pense qu'il s'agit plus simplement de migrer vers une nouvelle machine avec de bonnes ressources car un bon serveur peut gerer des milliers de services.

            ou est le problème ?

            Comment


            • #7
              Originally posted by xspoon
              oula ! vous vous compliquez la vie, là

              si c'est un projet de production et non pas de recherche, je pense qu'il s'agit plus simplement de migrer vers une nouvelle machine avec de bonnes ressources car un bon serveur peut gerer des milliers de services.

              ou est le problème ?
              Aucun problème mais il a le droit de vouloir répartir la charge de travail : au moins, il est prévoyant. Un « bon » serveur d'aujourd'hui tiendra combien de temps avant de devoir en augmenter les ressources ?
              Nagios permet de décentralisé les notifications mais, comme pour beaucoup d'aspect, il n'existe pas encore d'outils permettant de réaliser ce genre d'architecture de façon simple, à l'image d'un proxy ou des serveurs DNS/SMTP secondaires. Il ne suffit pas d'avoir un seul « bon » si celui devient le SPoF de ton SI.
              Raphaël 'SurcouF' Bordet
              Je ne teste pas mes plugins en root, tu ne testes pas tes plugins en root...
              Dons Paypal

              Comment


              • #8
                OK tout est envisageable, ça peut être un bon projet

                quand à qualifier une panne de supervision de SPoF de SI...

                surtout qu'on ne parle pas de redondance entre les machines mais de soulager une machine par une autre.

                je ne dirais pas que j'ai une experience d'acier dans le domaine de la monté en charge d'une plateforme Oreon mais est-ce qu'un serveur bi-pro moderne avec raid et optimisation du nagios ne permet pas d'assurer plus de 1000 services par minutes par exemple ?

                Comment


                • #9
                  Originally posted by xspoon
                  OK tout est envisageable, ça peut être un bon projet

                  quand à qualifier une panne de supervision de SPoF de SI...
                  Quand ton travail est précisément subordonné à l'utilisation de l'outil de supervision, le serveur et ses services deviennentt critiques. D'ailleurs, nous avons plusieurs indicateurs condidérés comme faisant partie de la QoS et la charge système ainsi que l'état du processus Nagios en font partie. Pour chaque indicateur, nous devons répondre de leur disponiblité mensuelle.
                  Donc, quand l'assurance de qualité des services rendus aux utilisateurs passent par la case supervision, ses outils deviennent automatiquement aussi critiques que les services assurés.

                  Originally posted by xspoon
                  surtout qu'on ne parle pas de redondance entre les machines mais de soulager une machine par une autre.
                  De la répartition de charge à du fail-over, il n'y a qu'un pas.
                  L'exemple des enregistrements DNS MX des serveurs SMTP en sont une parfaite représentation.

                  Originally posted by xspoon
                  je ne dirais pas que j'ai une experience d'acier dans le domaine de la monté en charge d'une plateforme Oreon mais est-ce qu'un serveur bi-pro moderne avec raid et optimisation du nagios ne permet pas d'assurer plus de 1000 services par minutes par exemple ?
                  Peu importe les capacités du serveur, Nagios finira de toutes façons par être bloqué par le nombre de processus ouverts. C'est bien pour ça qu'il faut limiter les forks inutiles.
                  En outre, la charge réseau peut vite devenir limitative sur un seul hôte.
                  Raphaël 'SurcouF' Bordet
                  Je ne teste pas mes plugins en root, tu ne testes pas tes plugins en root...
                  Dons Paypal

                  Comment


                  • #10
                    En outre, la charge réseau peut vite devenir limitative sur un seul hôte.
                    Il est vrai que la machine actuelle commence à saturer un petit peu.

                    Pour ton problème, la première chose à considérer est de savoir quels seront les rôles définis pour chacune des machines (notification, check, etc.) et d'en déduire les besoins en synchronisation.
                    Les rôles définis pour chaque machine serait :
                    - 2 machines qui ne font que faire les checks
                    - 1 machine qui reçoit ces résultats, qui envoient les notifications, qui affiche la totalité des services checkés.

                    Concernant la synchronisation entre les machines de checks et la troisième, je ne sais pas si c'est instantanée ou pas, car il le faudrait vu la fréquence des checks car nous avons un service au client derrière.

                    Mon idée était de répartir la charge de travail afin de pour ajouter des hosts à l'avenir sans que la machine ne s'éssoufle car plus ça va, plus il y a de choses à checker.

                    Comment


                    • #11
                      Nagios finira de toutes façons par être bloqué par le nombre de processus ouverts.
                      as-tu des chiffres pour comparer avec d'autres stations stp ?

                      En outre, la charge réseau peut vite devenir limitative sur un seul hôte.
                      j'ai du mal à extrapoler mon experience à ce sujet pour arriver à ta conclusion

                      exemple pour moi avec 200 services par minutes (petite station) sur un desktop mono-pross 2.6 gHz, le traffic ressemble à ça:



                      les pics en sortie correspondent aux consultations Web et les valeurs rrd sont fidèles, car le flux des checks est constant et donc la moyenne joue peu.

                      je veux bien que l'escalation de charge ne soit pas linéaire mais si tu as des valeurs qui contredisent cela, ça m'interesse ! pas pour le plaisir du débat mais pour prévoir aussi de mon coté la mise en place d'un serveur pour monitoring plus large .

                      Comment


                      • #12
                        Y'a t'il une date de prévu pour Centreon ou alors je suis obligé de passer par la méthode pas terrible qui serait d'installer un Oreon sur chaque machine afin de pouvoir ajouter les différents hôtes et services ?

                        Comment


                        • #13
                          ... ou un petit script qui coupe ton fichier services .cfg en deux une fois généré par oreon en faisant attention à ne pas le couper au milieu d'un service, puis un rsync qui synchronise la conf sur tes deux serveurs de check.
                          Un peu artisanal, mais tu aura tous tes hosts et 1/2 des services sur chaque serveur, et pas besoin d'oreon sur tes serveurs de check ... en attendant centreon

                          Comment


                          • #14
                            Originally posted by Erwan
                            Y'a t'il une date de prévu pour Centreon ou alors je suis obligé de passer par la méthode pas terrible qui serait d'installer un Oreon sur chaque machine afin de pouvoir ajouter les différents hôtes et services ?
                            Si ce travail est a l'initiative de la communauté, je dirais pas avant le deuxieme semestre 2007. Si un coup de pouce est apporte au projet, ca peut aller beaucoup plus vite. :idea:
                            Romain Le Merlus
                            Centreon Forge
                            MERETHIS

                            Comment

                            Working...
                            X