Cyrilpop
18th December 2008, 12:13
Salut à tous,
J'ai un système Nagios pour surveiller ma production. J'ai 331 serveurs (ce nombre augmente presque chaque jour), plus de 3000 services à surveiller. Les checks sont fait entre toutes les 5/10 minutes à toutes les demis heures.
Le problème est le suivant :
- si je lance le service ndo2db afin de pouvoir utiliser Nagvis / Nagios prend du retard sur les checks. Il prend beaucoup de retard : en l'espace de 30 minutes le retard accumulé est de 5 minutes. Ce retard ne cesse d'augmenter au fil du temps ce qui m'oblige à arrêter ndo2db donc Nagvis. Pour information, avant que l'on s'en rende compte le retard accumulé a atteint 36 heures en 1 week-end... (pour des services TRES sensibles sous astreinte avouez que c'est limite...)
Pour information voici la configuration :
Disques
SysFichier 1K-blocs Utilisé Dispo. Util% Monté sur
/dev/cciss/c0d0p2 248895 185442 50601 79% /
/dev/Volume00/LogVol06 297485 237472 44653 85% /exploit
/dev/Volume00/LogVol07 2064208 1959352 0 100% /export
/dev/Volume00/LogVol02 2043787 1196780 847007 59% /home
none 515164 0 515164 0% /dev/shm
/dev/Volume00/LogVol03 249903 5716 231285 3% /tmp
/dev/Volume00/LogVol00 4128448 3687512 231224 95% /usr
/dev/Volume00/LogVol01 380807 106706 254441 30% /var
/dev/Volume00/LogVol04 1032088 204380 775280 21% /vtom
/dev/Volume00/LogVol05 15320532 2954140 11588152 21% /vtomlogs
/dev/Volume01/oraclelv 5077465 4167 4811154 1% /oracle
Configuration matérielle
11:12:25 up 8 days, 3:34, 2 users, load average: 0,15, 0,54, 0,59
115 processes: 113 sleeping, 2 running, 0 zombie, 0 stopped
CPU0 states: 2,0% user 6,0% system 0,0% nice 0,0% iowait 90,0% idle
CPU1 states: 19,0% user 15,0% system 0,0% nice 0,0% iowait 65,0% idle
Mem: 1030332k av, 776240k used, 254092k free, 0k shrd, 97956k buff
529140k actv, 54072k in_d, 14120k in_c
Swap: 2044072k av, 59584k used, 1984488k free 478644k cached
Merci à tous de votr aide :)
J'ai un système Nagios pour surveiller ma production. J'ai 331 serveurs (ce nombre augmente presque chaque jour), plus de 3000 services à surveiller. Les checks sont fait entre toutes les 5/10 minutes à toutes les demis heures.
Le problème est le suivant :
- si je lance le service ndo2db afin de pouvoir utiliser Nagvis / Nagios prend du retard sur les checks. Il prend beaucoup de retard : en l'espace de 30 minutes le retard accumulé est de 5 minutes. Ce retard ne cesse d'augmenter au fil du temps ce qui m'oblige à arrêter ndo2db donc Nagvis. Pour information, avant que l'on s'en rende compte le retard accumulé a atteint 36 heures en 1 week-end... (pour des services TRES sensibles sous astreinte avouez que c'est limite...)
Pour information voici la configuration :
Disques
SysFichier 1K-blocs Utilisé Dispo. Util% Monté sur
/dev/cciss/c0d0p2 248895 185442 50601 79% /
/dev/Volume00/LogVol06 297485 237472 44653 85% /exploit
/dev/Volume00/LogVol07 2064208 1959352 0 100% /export
/dev/Volume00/LogVol02 2043787 1196780 847007 59% /home
none 515164 0 515164 0% /dev/shm
/dev/Volume00/LogVol03 249903 5716 231285 3% /tmp
/dev/Volume00/LogVol00 4128448 3687512 231224 95% /usr
/dev/Volume00/LogVol01 380807 106706 254441 30% /var
/dev/Volume00/LogVol04 1032088 204380 775280 21% /vtom
/dev/Volume00/LogVol05 15320532 2954140 11588152 21% /vtomlogs
/dev/Volume01/oraclelv 5077465 4167 4811154 1% /oracle
Configuration matérielle
11:12:25 up 8 days, 3:34, 2 users, load average: 0,15, 0,54, 0,59
115 processes: 113 sleeping, 2 running, 0 zombie, 0 stopped
CPU0 states: 2,0% user 6,0% system 0,0% nice 0,0% iowait 90,0% idle
CPU1 states: 19,0% user 15,0% system 0,0% nice 0,0% iowait 65,0% idle
Mem: 1030332k av, 776240k used, 254092k free, 0k shrd, 97956k buff
529140k actv, 54072k in_d, 14120k in_c
Swap: 2044072k av, 59584k used, 1984488k free 478644k cached
Merci à tous de votr aide :)