Bonjour,
Une nouvelle de taille est apparu durant le déploiement et les tests de charges de NAGIOS.
Une archi distribuée permet de répartir l'ensemble des check sur plusieurs services. Mais la contrepartie a un prix lourd.
je m explique :
Pour chaque service sur un SA le parametre obsess_over_service est à 1 et le ocsp_command lance le send_nsca. Nénamoins le nombre, de paquets NSCA envoyé est très important. Sur le serveur Central pour paquets le daemon NSCA cré un fork pour écrire dans le pipe de nagios (/var/rw/nagios.cmd). Le nombre de notif est tellement important que cet envoi massif génére sur le serveur un blocage est un mise en attente des notif suivante. Ce qui n'est pas génant sur le SI, l'est beaucoup plus sur le SA. En effet un nombre important de connexion de send_nsca sont en TIME_WAIT, sachant que l'oscp_command doit d etre fini pour entamer un nouveau check (pour un service donné). La latence d'un service monte de maniere non négligeable =~ + 30 secondes.
1ere question : l'un de vous a deja rencontré ce probleme?
2ème : une idée sur la solution?
3ème : quel mode de fonctionnement nsca utilisé vous? (deamon, inetd, xinetd)
NOTE : je vais faire des graphs avec la latence moyenne avec différents réglage nagios / mode de nsca
Une nouvelle de taille est apparu durant le déploiement et les tests de charges de NAGIOS.
Une archi distribuée permet de répartir l'ensemble des check sur plusieurs services. Mais la contrepartie a un prix lourd.
je m explique :
Pour chaque service sur un SA le parametre obsess_over_service est à 1 et le ocsp_command lance le send_nsca. Nénamoins le nombre, de paquets NSCA envoyé est très important. Sur le serveur Central pour paquets le daemon NSCA cré un fork pour écrire dans le pipe de nagios (/var/rw/nagios.cmd). Le nombre de notif est tellement important que cet envoi massif génére sur le serveur un blocage est un mise en attente des notif suivante. Ce qui n'est pas génant sur le SI, l'est beaucoup plus sur le SA. En effet un nombre important de connexion de send_nsca sont en TIME_WAIT, sachant que l'oscp_command doit d etre fini pour entamer un nouveau check (pour un service donné). La latence d'un service monte de maniere non négligeable =~ + 30 secondes.
1ere question : l'un de vous a deja rencontré ce probleme?
2ème : une idée sur la solution?
3ème : quel mode de fonctionnement nsca utilisé vous? (deamon, inetd, xinetd)
NOTE : je vais faire des graphs avec la latence moyenne avec différents réglage nagios / mode de nsca
Comment