wesh
11-03-2007, 02:01 AM
Salut à tous !
Je tourne sur une Etch et j'utilise Nagios 2.6 + Centreon 1.4.1 + ODS + php5 + mysql5. La bécane est un Dell bi-xeon 2.8 avec 2.5 Go de DDR... Les 2 disques sont des SCSI 73 Go.
Je monitor essentiellement du trafic et de la latence sur 200 hosts.
80% des hosts sont des éléments actifs de type Nortel, Cisco, MRV, Procurve.
Le reste sont des serveurs Linux.
L'interface graphique est sur une machine publique et fait les check via nrpe sur une machine dans le LAN qui peut interroger tous les sous-réseaux.
Tout allait très bien, mais depuis 2 jours, les graphs sont troués, et j'ai régulièrement des états CRITICAL dans le monitoring. Les weathermaps se retrouvent avec des liens gris à 0% alors que la plupart des éléments actifs sont au boulot...
J'ai bien parcouru les threads de ce forum, mais je ne vois pas comment optimiser la conf... parce que 200 hosts, ce n'est pas grand'chose... Il m'en reste encore autant à faire...
J'ai d'abord pensé à des problèmes connus sur les Nortel (si l'UPTIME est trop grand par exemple, on a quelques soucis avec certains effets de bascule de trafic selon les trunk et on perd le ping)... Mais les reboot nocturnes réguliers de certains éléments actifs ne changent rien...
Je me dis alors que c'est le trio centreon/ods/nagios qui ne suit pas la cadence, parce que j'ai du mal à croire que la machine y est pour quelque chose...
Comment faites-vous pour optimiser vos conf ?
Pour les services, que mettez-vous dans les ordonnancements réguliers ? irréguliers ?
Merci de m'avoir lu et de vos réponses...
http://img124.imageshack.us/img124/8816/36015496nk7.th.jpg (http://img124.imageshack.us/my.php?image=36015496nk7.jpg)
http://img124.imageshack.us/img124/7017/70934171lo8.th.jpg (http://img124.imageshack.us/my.php?image=70934171lo8.jpg)
http://img140.imageshack.us/img140/4799/68450635yy0.th.jpg (http://img140.imageshack.us/my.php?image=68450635yy0.jpg)
Je tourne sur une Etch et j'utilise Nagios 2.6 + Centreon 1.4.1 + ODS + php5 + mysql5. La bécane est un Dell bi-xeon 2.8 avec 2.5 Go de DDR... Les 2 disques sont des SCSI 73 Go.
Je monitor essentiellement du trafic et de la latence sur 200 hosts.
80% des hosts sont des éléments actifs de type Nortel, Cisco, MRV, Procurve.
Le reste sont des serveurs Linux.
L'interface graphique est sur une machine publique et fait les check via nrpe sur une machine dans le LAN qui peut interroger tous les sous-réseaux.
Tout allait très bien, mais depuis 2 jours, les graphs sont troués, et j'ai régulièrement des états CRITICAL dans le monitoring. Les weathermaps se retrouvent avec des liens gris à 0% alors que la plupart des éléments actifs sont au boulot...
J'ai bien parcouru les threads de ce forum, mais je ne vois pas comment optimiser la conf... parce que 200 hosts, ce n'est pas grand'chose... Il m'en reste encore autant à faire...
J'ai d'abord pensé à des problèmes connus sur les Nortel (si l'UPTIME est trop grand par exemple, on a quelques soucis avec certains effets de bascule de trafic selon les trunk et on perd le ping)... Mais les reboot nocturnes réguliers de certains éléments actifs ne changent rien...
Je me dis alors que c'est le trio centreon/ods/nagios qui ne suit pas la cadence, parce que j'ai du mal à croire que la machine y est pour quelque chose...
Comment faites-vous pour optimiser vos conf ?
Pour les services, que mettez-vous dans les ordonnancements réguliers ? irréguliers ?
Merci de m'avoir lu et de vos réponses...
http://img124.imageshack.us/img124/8816/36015496nk7.th.jpg (http://img124.imageshack.us/my.php?image=36015496nk7.jpg)
http://img124.imageshack.us/img124/7017/70934171lo8.th.jpg (http://img124.imageshack.us/my.php?image=70934171lo8.jpg)
http://img140.imageshack.us/img140/4799/68450635yy0.th.jpg (http://img140.imageshack.us/my.php?image=68450635yy0.jpg)