View Full Version : hosts derriere un routeur
cesium
22nd January 2008, 12:48
Bonjour voila mon souci :
je controle un routeur et des machines derriere le routeur donc j'ai indiqué que le routeur avait des Hosts enfants
mais le probleme c'est que ca ne marche pas dans tout les cas. sur certains routeur cette config fonctionne mais pas sur d'autre alors que la config est la meme. comment l'expliquez vous?
Merci
naparuba
22nd January 2008, 13:46
Tu peux regarder directement dans ton fichier hosts.cfg et regarder les champs "parents" afin de voir si les infos sont bien exportées?
cesium
22nd January 2008, 14:08
Merci pour ton info
Mais c'est bien le cas dans le hosts.cfg...
naparuba
22nd January 2008, 14:27
Ah, donc c'est un problème de Nagios. Tu as quoi comme symptôme exactement? Que vois-tu fonctionner sur certains et pas d'autres?
Il faut faire attention, la dépendance se fait sur les erreurs de hosts down, et non pas host down entraine plus de notification de services sur le host.
cesium
22nd January 2008, 15:01
en fait je ne sais pas si je me suis bien fais comprendre mais le hosts.cfg est bien renseigné au niveau des "parents"
je reexplique mon cas avec des exemples.
je dois controler 20 sites distants sur chaque site je dois controler le routeur (vpn) et 3 machines derierre.
je prends l'exemple sur un site distant le routeur tombe je suis averti que le routeur est tombé mais pas machines derriere, jusque la tout va bien.
je prends mon 2eme site le routeur tombe j'en suis averti ainsi que toute les machines derriere et ca je ne veux pas.
et naparuba j'ai pas tout compris ton explication des hosts down...
naparuba
22nd January 2008, 15:50
L'utilisation que tu veux en faire est bien la bonne, et vu que c'est bien dans le .cfg je ne vois pas trop. Nagios.log ne crie pas? Lorsque tu as une notification des enfants, le host parent était déjà down? L'alerte que tu as (enfants) c'est un "host down" ou bien "host unknown"?
Pour mon point sur les host/services: si un parent est tombé, tu n'aura pas l'alerte comme quoi l'enfant n'est pas dispo (enfin, normalement...) mais tu auras tout de même les alertes des services se trouvant dessus, ce qui fait tout de même pas mal de mails qui arrivent en général. Pour éviter cela j'ai fait un petit hack au code de Nagios, qui ne sera plus nécessaire avec Nagios3.
cesium
22nd January 2008, 17:48
En effet ca m'eclaire un peu car en regardant mieux quand le routeur est down, l'enfant est unreachable...
peut etre faudrait t'il voir de se coté...
naparuba
22nd January 2008, 18:00
Oui, ca c'est le comportement normal. Il faut voir si tu as des erreurs au niveau host, ou au niveau service. Si c'est au niveau des services et que ca t'embête, je peux te passer mon hack (4lignes de codes dans nagios), il permet si le host est en unknown de passer le service en unknown également.
cesium
24th January 2008, 12:18
je suis arrivé a resoudre cela en changeant ma commande de check( check_host_alive par check_centreon_ping)
merci quand meme.
et puis pendant que je t'ai sous la main mon autre probleme est que lorsque qu'un hote est down nagios ainsi que centreon mettent longtemp a detecter qu'il est de nouveau up alors qu'il est bien en vie.
(je controle 88 hosts)
naparuba
25th January 2008, 09:48
Hum... Tu as des checks de service sur ce host? Sinon il me semble que la commande aggressive host check pourrait aider.