View Full Version : compteurs SNMP faux !
stekut
28th October 2008, 12:14
Bonjour à tous,
je poste ici car mon problème n'est ni lié à Nagios ni lié à Centreon.
Suite à une alarme m'indiquant qu'un serveur avait son taux CPU en critique, je me loggue sur la bécane, je fais un top et là je constate que le taux CPU ne dépasse pas 5% au niveau user, 1% au niveau système.
J'effectue donc mes requêtes SNMP à la mano et voilà ce que j'obtiens :
UCD-SNMP-MIB::ssCpuUser.0 = INTEGER: 45
UCD-SNMP-MIB::ssCpuSystem.0 = INTEGER: 47
UCD-SNMP-MIB::ssCpuIdle.0 = INTEGER: 7
Celà me rassure un peu, Centreon n'est pas dingue, c'est le serveur qui me retourne des valeurs SNMP aberrantes...Pourquoi ?
Quelqu'un connaît-il ce problème ? Pour info, une mise à niveau des packages SNMP ne résout pas le problème.
surcouf
28th October 2008, 14:24
Bonjour à tous,
je poste ici car mon problème n'est ni lié à Nagios ni lié à Centreon.
Suite à une alarme m'indiquant qu'un serveur avait son taux CPU en critique, je me loggue sur la bécane, je fais un top et là je constate que le taux CPU ne dépasse pas 5% au niveau user, 1% au niveau système.
J'effectue donc mes requêtes SNMP à la mano et voilà ce que j'obtiens :
UCD-SNMP-MIB::ssCpuUser.0 = INTEGER: 45
UCD-SNMP-MIB::ssCpuSystem.0 = INTEGER: 47
UCD-SNMP-MIB::ssCpuIdle.0 = INTEGER: 7
Celà me rassure un peu, Centreon n'est pas dingue, c'est le serveur qui me retourne des valeurs SNMP aberrantes...Pourquoi ?
Quelqu'un connaît-il ce problème ? Pour info, une mise à niveau des packages SNMP ne résout pas le problème.
Oui, « problème » également connu : ces OID sont obsolètes (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#scalar_notcurrent) (la mention apparaît dans la description de la MIB). Il faut utiliser les OID équivalents en données brutes (« Raw »), soit :
- UCD-SNMP-MIB::ssCpuRawUser.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawUser) ;
- UCD-SNMP-MIB::ssCpuRawNice.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawNice) ;
- UCD-SNMP-MIB::ssCpuRawSystem.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawSystem) ;
- UCD-SNMP-MIB::ssCpuRawIdle.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawIdle) ;
- UCD-SNMP-MIB::ssCpuRawWait.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawWait) ;
- UCD-SNMP-MIB::ssCpuRawKernel.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawKernel) ;
- UCD-SNMP-MIB::ssCpuRawInterrupt.0 (http://net-snmp.sourceforge.net/docs/mibs/ucdavis.html#ssCpuRawInterrupt).
Comme il s'agit de données brutes, il faut effectuer deux fois la mesure dans un intervalle relativement court (de l'ordre de deux à trois secondes) et calculer le pourcentage pour chacun d'entre eux.
Attention, ssCpuRawIdle doit bien évidemment être pris à l'envers par rapport aux autres car 99% de processus en idle n'est pas une situation critique.
Bien qu'il s'appuie sur mon module Nagios::Plugin::NetSNMP, c'est exactement ce que fait mon plugin check_ucd-snmp_cpu_usage.pl (http://projects.debianfr.net/projects/perl-nagios-plugin-snmp/browser/trunk/plugins/check_ucd-snmp_cpu_usage.pl) (Toutefois, il ne traite pas les trois derniers OID cités précédemment).
stekut
28th October 2008, 17:36
Merci pour ces infos, ça me rassure un peu, par contre ca implique certaines modif', je me demande pourquoi je n'ai pas eu ce problème avant...
stekut
12th March 2009, 16:43
Où pourrais-je trouver ton module Nagios::Plugin::NetSNMP ???
stekut
21st April 2009, 14:17
Petit up, je n'ai pas eu de retour, est-il possible d'avoir ton module pour utiliser ton script ???
Ce serait chouette...
Merci.