View Full Version : Dimensionnement Hardware
Bonjour,
J'ai 3 petites questions sur le dimensionnement hardware qui restent sans réponse malgré mes recherches, et comme rien ne remplace l'expérience, je vous soumets ces questions :
1. Est-il utile d'avoir un CPU quad core (nagios le gère t-il ???) ?
2. Si oui, y a t-il une configuration particulière à faire ?
3. Est-ce délirant de partir sur 100/150 checks simultanés ?
En vous remerciant
Cordialement.
nunki
19th May 2009, 14:12
Bonjour,
J'ai eu l'occasion de lire plusieurs informations concernant le dimensionnement d'un serveur et la réponse que j'en ai déduite est la suivante: il n'y a pas de solution miracle! En gros, tout dépendra du nombre de service que tu aura.
Tu parles de "100/150 checks simultané", ça veut dire quoi? C'est le nombre de check que tu auras en moyenne par minute? Par ce que l'instantané, ça n'existe pas ;)
Je parle de checks en parallèle, on peut le ramener aux nombres de checks à la minute.
Pour une supervision de 20.000 services, as-tu un ordre d'idée du dimensionnement ?
naparuba
19th May 2009, 15:22
20000 par minute? Ca fait beaucoup pour un Nagios seul. Ca va dépendre des sondes, mais mieux vaut partir sur un Nagios central et 3 satellites dans ce cas là.
Je me rends compte que je me suis mal exprimé.
Le but n'est pas de faire 20000 checks/min.
J'ai un parc de machine à superviser qui représente 20.000 services.
Ma première question est de savoir si Nagios gère le quad core ? ou si il n'est pas optimisé pour exploiter un quad core.
Ensuite, est-ce jouable sur un seul serveur de monitorer 20000 services.
naparuba
19th May 2009, 15:48
Oui il sait très bien utiliser plusieurs CPU, sans pb. Ensuite, 20000 services pour un seul Nagios, ca dépends de ton ordonnancement: si c'est 20000 tests par jour, tu prends un PC, si c'est 20000 en 5 minutes, tu prends un monstre de serveur :)
En gros, avec des checks "normaux", un serveur lambda (4coeurs à 3ghz) ca monte entre 5000 et 8000 tests en 5 minutes sans tuning. Pour plus, il faut optimiser les plugins et tuner Nagios.
Donc la question est: tes 2000 tests, c'est tout le combien de temps?
Ce sera principalement de la supervision "normale ++" alors.
Les 20000 checks devront être réalisé dans un laps de temps maxi de 10min/15min.
Par contre, il va falloir que je prenne en compte les ralentissements causés par NDO.
Merci pour toutes tes infos qui me rassurent énormément.
Je vais quand même réfléchir à une archi distribuée, bien que ceci soit plus onéreux.
Encore merci.
nunki
19th May 2009, 16:07
Je serai intéressé pour avoir un retour sur ton expérience avec la quantité de service que tu as ;)
Merci d'avance!
Guigui2607
19th May 2009, 16:22
Hé hé :D
Effectivement assez difficile à quantifier comme ça...
20 000 services dans un laps de temps 10~15min... Ça risque de faire juste à mon goût... Ça dépend aussi de ce qui va 'tourner' sur ton serveur en parallèle (MySQL, Centreon, etc...)
Perso: 1 serveur Xeon 2.66Ghz (QuadCore) - 8Go RAM
Supervision de +12 000 services (+2200 Host) toutes les 10~15min...
Pas de Mysql -> pas de Ndo, ni de Centreon.
Supervision OK, avec une petite dizaine de seconde de latence...
A voir aussi quelles types de requêtes utilisées... NRPE, NSCA, SNMP, WMI...
Comme le propose Naparuba, une architecture distribuée pourrait être envisageable dans ton cas...
Merci à tous, ca aide d'avoir des exemples de spec de machines...
Je vais prendre en considération les conseils sur l'architecture distribuée et réfléchir à comment mettre ça en place.
Petites questions,
Sur les nagios satellites, les données ne sont pas stockées ? elles sont envoyées au serveur principal par ndomod ?
Du coup, l'espace disque sur les satellites n'a pas besoin d'être énorme ???*
nunki
19th May 2009, 17:55
Effectivement! Toutes les données sont stockées au niveau du serveur principal. Il y aura uniquement les logs de Nagios qui vont grossir avec le temps.
Guigui2607
19th May 2009, 17:58
Et là on met en place une purge automatique des logs et le tour est joué :D
Une question pour GuiGui2607 :
Perso: 1 serveur Xeon 2.66Ghz (QuadCore) - 8Go RAM
Supervision de +12 000 services (+2200 Host) toutes les 10~15min...
Est-ce que tu peux nous donner la consommation de RAM max/moyenne, juste pour indication ?
Merci d'avance ;)
Guigui2607
20th May 2009, 10:57
Pour le moment, une conso moyenne de la moitié.
Mais pas de mysql, pas de centreon ni ndo, juste un Nagios...
nunki
20th May 2009, 11:17
@Guigui2607: avec une architecture comme la tienne, NDO devrait pouvoir tenir sur ton serveur sans trop de mal? C'est juste histoire d'avoir une idée du dimensionnement en utilisant la solution complète nagios, ndo, centreon ;)
Guigui2607
20th May 2009, 12:17
Juste NDO, oui, je pense...
Mais pendant un temps, il avait été envisagé d'implémenter Centreon sur ce serveur, mais il a eu une période où la latence des checks était devenue très importante...
L'implémentation de Centreon a alors été repoussée.
L'idée serait de monter un serveur tiers qui hébergerait un Nagios et un Centreon qui récupérerait les données de mon serveur Nagios actuel...
nunki
23rd June 2009, 15:47
Bonjour,
je me permets de faire remonter ce post car j'ai une problématique de dimensionnement.
Je pars pour avoir environ 4000 checks toutes les 5 min. Sauf que, ils veulent installer cette solution sur une machine virtuelle (un serveur ESXi). Également, il y aura centreon + ndo + BDD sur cette même machine.
Je pars sur 2Go de RAM mais je me demande si ce sera suffisant...
Vous en pensez quoi?
naparuba
23rd June 2009, 15:51
Je pense que le problème ne viendra pas de la RAM mais du CPU. 4000 sur un ESX, ça va être limite. Prévois si possible un second poller si tu vouis la latence qui monte.
nunki
23rd June 2009, 17:30
Tiens, par rapport au dimensionnement, j'ai une question qui me vient en tête!
En terme de performance, il est plus intéressant de déclarer des services pour un groupe d'hote ou de déclarer un template de service que nous affectons à chaque hote d'un groupe d'hote?
Pour un service affecté à un groupe d'hote, Nagios va en réalité créer un service pour chaque hote du groupe d'hote?
naparuba
23rd June 2009, 17:57
Exactement. Il n'y a pas de différence. C'est juste une facilité de configuration.
DonKiShoot
23rd June 2009, 20:56
Pfff ces bouffons de DI qui veulent tout mettre sur ESX avec des perfs pourries juste pour rentabiliser leur jouet et ne pas passer pour des cons auprès de leur direction à qui ils ont tenu le même discours ponpeu que le commercial de la SSII qui les a enfumé.
Quelqu'un à mis en place une supervision performante avec un nagios conséquent (>1000 services actifs) sur un esx composé d'autres vm qui tournent pour quelque chose ? :D
naparuba
24th June 2009, 09:18
Moi à une époque, mais j'ai eu du mal à dépasser les 3-4000 services toutes 5 minutes et pourtant je suis monté dans les Vcpu. D'ailleurs, ça, les commerciaux oublient souvent de le dire : oui ça gère officiellement pleins de CPU, mais ça a du mal avec plus de 2 : )
nunki
24th June 2009, 09:31
Et oui...Le serveur virtuel, c'est pas mon idée :)
naparuba
24th June 2009, 09:36
Ca peut être bien je ne dis pas, mais pas pour les grands environnements qui ont besoin de perf (je parle en ESXv3, je n'ai pas encore tenté la V4). Sinon il faut pleins de pollers, mais on perd un peu d'intérêt de lo virtualisation s'il faut multiplier les VM...
khetzal
24th June 2009, 14:03
Quelqu'un à mis en place une supervision performante avec un nagios conséquent (>1000 services actifs) sur un esx composé d'autres vm qui tournent pour quelque chose ? :D
Oui, plus de 3000 services sur du esx qui gere aussi dns, ldap+kerberos, serveurs applicatifs (3), et plein d'autres choses
DonKiShoot
24th June 2009, 20:47
Oui, plus de 3000 services sur du esx qui gere aussi dns, ldap+kerberos, serveurs applicatifs (3), et plein d'autres choses
Et tout les graphs sont niquels ? Pas de trou dans les courbes ? (sous entendu les checks s'éffectuent bien à l'heure souhaité)
khetzal
24th June 2009, 21:09
Non ca passe impec, suffit de faire les checks en passifs (sauf pour les trucs pour lesquels ca passe pas, par exemple, les cisco ou les imprimantes). Avant, avec tout en actif, meme sur une machine physique, c'etait pas top (c'est des postes clients, souvent eteinds, + quelques serveurs, donc nagios etait en attente de resultats la plupart du temps)
DonKiShoot
25th June 2009, 14:32
Non ca passe impec, suffit de faire les checks en passifs (sauf pour les trucs pour lesquels ca passe pas, par exemple, les cisco ou les imprimantes). Avant, avec tout en actif, meme sur une machine physique, c'etait pas top (c'est des postes clients, souvent eteinds, + quelques serveurs, donc nagios etait en attente de resultats la plupart du temps)
Ah ba je comprend mieux ta réponse !!
ESX oui ! Mais que pour du passifs :D
PS: mon post de départ posé la question pour (>1000 services actifs)
nunki
26th June 2009, 09:48
en passif signifie installer un agent sur les éléments de supervision -> beurk!
Forcément, en passif, le serveur est moins sollicité!