Announcement

Collapse
No announcement yet.

Demande de conseils architecture distribuée - haute-disponibilité

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Demande de conseils architecture distribuée - haute-disponibilité

    Hello,

    Je suis en train de bosser pour mettre en place une architecture distribuée Nagios + Centreon avec plusieurs satellites.

    Je voudrais connaître les différentes possibilités pour rendre mon infrastructure Nagios / Centreon toujours disponible. (redondance, tolérance de pannes, etc...). Le but étant d'avoir une haute dispo à tous les niveaux de l'architecture...

    J'ai déjà un œil sur le MySQL Cluster... Je suis en train voir ce qui est faisable avec...

    Pour le moment, j'ai prérvu d'utiliser les dernières version de chacun des composant:
    • Nagios 3.2.1
    • Centreon 2.1.5
    • NDOutils 1.4b9 ou le Centreon broker qu'il faut que je teste.
    • MySQL 5.x


    Je suis en train de voir aussi pour éventuellement doubler Centreon (services, interface...), voir aussi ce qui faisable en terme de redondance au niveau des satellites.

    Bref en gros, avoir une redondance du service à un peu près tous les niveaux de l'architecture en cas de panne.



    Quels sont vos moyens employés pour rendre votre (vos) infrastructure(s) toujours opérationnelle(s) ?

    Merci d'avance
    Guigui

    > PAS DE SUPPORT VIA MP <

    "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

  • #2
    Salut,

    pour mon cas je n'ai jamais trouvé de moyen idéal pour arriver à cela. Tu peux mettre un cluster MySQL + 2 Centreons (actif/passif genre avec un heartbeat) mais reste la couche Nagios qui a des problèmes à être hautement disponible "efficacement" car tu peux passer par les commandes OCSP and co, mais là tu dis byebye à tes perfs (ce qui est embêtant hein ).

    C'est en parti pour résoudre ça que j'ai commencé à coder Shinken d'ailleurs. Je sais que le Cetnreon Broker tente aussi de palier ce problème, mais je ne sais pas encore quand il sera dispo.

    Bref, pour les petits environnements la haute dispo ça marche, mais dès que tu as un environnement un minimum costau, bah....
    Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

    Comment


    • #3
      Salut Nap,

      Oui, effectivement pas grand chose à ce sujet sur le Net...
      Je pense pour le moment me pencher sur un cluster MySQL pour Centreon. Mais pour Nagios j'ai pas l'impression qu'il existe un réel moyen d'avoir de la vraie haute dispo...
      J'imagine pourquoi pas mettre en place un serveur Nagios "vierge" en "spare". Si jamais un satellite vient à flancher (crasher ?!?) j'aurais la possibilité de re-plaquer rapidement avec Centreon la conf du serveur Nagios crashé sur le satellite vierge...

      Bon, j'ai encore pas vu un de mes serveurs Nagios se vautrer, mais bon, on ne sait jamais :mrgreen:

      Encore une fois merci pour tes précieux conseils mile:
      Guigui

      > PAS DE SUPPORT VIA MP <

      "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

      Comment


      • #4
        C'est exactement ce que j'ai fais !!
        J'ai testé le PRA et ca marche très bien !!
        Sauvegarde des bases de données tout les jours à 19heures + les plugins...

        J'ai doublé mon architecture (j'ai fais des VMS) qui est distribuée...

        Pour le futu j'aimerai mettre en place de la haute dispo ! mais comme toi j'ai pas l'impression que ca se fait actuellement (à moins de bidouiller comme un fou...)
        Centreon 2.3.3 / Nagios3.2.1 / Ndo 1.4b7
        Hotes : 1400 / Services : 17 500
        Architecture distibuée, 1 central / 4 satellites
        BDD déportée
        Réplication temps réelle BDD mysql
        PRA

        Comment


        • #5
          Merci pour tes infos Pinault22

          Bon, je me sens pas trop de bidouiller comme un fou :evil:
          Mais je pense que l'orientation vers un cluster MySQL avec 2 Centreon serait déjà une bonne piste. Je vais voir ce que ça peut donner.

          Je vous tiens au courant de mes recherches de toutes façons
          Guigui

          > PAS DE SUPPORT VIA MP <

          "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

          Comment


          • #6
            Re,

            Bon pour le moment, je suis plus (+) parti sur une 'simple' réplication MySQL que sur un Cluster.

            Côté checks, on s'orienterait désormais vers du "tout passif". Les Nagios satellites ne remonteraient les infos qu'au Principal.

            Cependant, on me demande, si les serveurs Nagios peuvent être virtualisé ?
            -> le serveur Principal [hébergeant au passage MySQL] ainsi que les satellites.

            - Pour les satellites, qui ne feront plus de checks actifs, je ne vois pas vraiment de points bloquants.
            - Mais pour le Principal, je reste cependant assez frileux.

            Sachant qu'il y a Centreon, et MySQL qui tournent dessus. (pas mal de requêtres I/O disk....)
            Pour la partie nagios, il n'y aura que Ndo2db qui travaillera puisque tout sera passif.

            Est-ce que d'après vous, ces virtualisations semblent envisageables, ou je vais droit dans le mur (surtout pour le cas du Principal)... ?!?
            Guigui

            > PAS DE SUPPORT VIA MP <

            "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

            Comment


            • #7
              Mais comment tu remontes les infos au principal ? Avec des commandes genre OCSP? Car là tu vas perdre en perf sur les satellites
              Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

              Comment


              • #8
                Hello Nap,

                Les satellites remontent les infos au Principal via ndomod :???:
                Ensuite, c'est poussé en base avec Ndo2db pour Centreon.
                Guigui

                > PAS DE SUPPORT VIA MP <

                "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

                Comment


                • #9
                  Ah, je pensais que tu voulais agréger les données dans un daemon Nagios plutôt que directement en base.

                  Tu as un gros parc non? J'avoue que je ne sais pas trop ce que va donner la base MySQL en VM avec beaucoup de requêtes, mais bon.

                  Mais pour le hautement disponible tu veux faire comment? Car chaque poller est responsable d'une partie de la conf, s'il tombe bah.... pas de bol
                  Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

                  Comment


                  • #10
                    Oui, un gros parc...
                    L'idée serait de virtualiser le MySQL sur une autre VM.
                    Pour les requêtes, je cherche un outil pour les mesurer le nombre par seconde, ou par minute, sur mon serveur actuel pour faire un point.

                    Pour les Satelites, je pensais en prévoir un en "spare" où seul nagios est installé dessus.
                    Dès qu'un satellite tombe, via centreon je pouse la conf du satellite qui vient de tomber sur le satellite "spare"...

                    C'est pas automatique, mais ça permet de ne par trop perdre de temps en cas de problème.
                    Guigui

                    > PAS DE SUPPORT VIA MP <

                    "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

                    Comment


                    • #11
                      Hello messieurs

                      De mon coté je suis le post car j'ai aussi, tout est relatif, un parc conséquent de 2800 équipements réseaux (essentiellement Cisco) a monitorer/superviser et il serait bon de voir pour de la haute dispo.

                      On ne me l'a pas demandé car on a toujours l'ancienne plateforme Nagios en backup mais pas à jour par rapport à l'évolution de notre réseaux.

                      Si de mon coté j'ai des infos je vous tiens au jus d'orange
                      Ubuntu Server 10.04.4 x64 - Centreon 2.1.13 - Nagios 3.2.0
                      Modules : ImportCSV 0.99rc5 - OCS2Cent 1.2.1 - Centreon-Gmap 1.2 - ndotools 0.2 - Centreon-NagVis 2.2b with NagVis 1.5.10

                      Comment


                      • #12
                        Pour faire suite a un échange avec nap, il y a ce projet de notre nap national :cool:

                        http://www.shinken-monitoring.org/

                        Je n'ai pas encore tout lu et malheuresement plus pages sont blanche chez moi, mais ca a l'air vraiment intéressant.
                        j'ai trouvé pas mal de chose egalement sur le website de nap : http://www.gabes.fr/jean/

                        Ubuntu Server 10.04.4 x64 - Centreon 2.1.13 - Nagios 3.2.0
                        Modules : ImportCSV 0.99rc5 - OCS2Cent 1.2.1 - Centreon-Gmap 1.2 - ndotools 0.2 - Centreon-NagVis 2.2b with NagVis 1.5.10

                        Comment


                        • #13
                          Oui, oui, je suis aussi son projet de très près
                          Guigui

                          > PAS DE SUPPORT VIA MP <

                          "Ce n'est qu'en essayant continuellement que l'on finit par réussir. En d'autres termes, plus ça rate et plus on a de chances que ça marche !!" (Shadoks)

                          Comment


                          • #14
                            J'ai refait le site pour qu'il soit bien plus clair

                            Pour ceux qui veulent un résumé, il y a une animation flash qui résume un peu l'architecture : http://www.shinken-monitoring.org/th...-architecture/ :mrgreen:
                            Auteur de Shinken, outil de supervision compatible avec Nagios et orientée supervision distribuée hautement disponible et mulitplateforme.

                            Comment


                            • #15
                              Bonjour,
                              J'ai bien vu que tu maitrise l'architecture distribuée.
                              don voilà j'ai utilisé:http://fr.doc.centreon.com/DistributedArchitecture/fr
                              mais apparemment j'ai pas installé centcore du coup je suis coincé.
                              Que dois-je faire??????????

                              Comment

                              Working...
                              X