PDA

View Full Version : Nagios : configuration et performances


gae
7th May 2007, 12:57
Bonjour à tous, un petit post sup pour une question - débat à propos des perfs nagios et de sa conf :


le but de ce post est double :
1) résoudre mon problème (ca va de soit)
2) voir si pn ne peut pas trouver une conf plus ou moins générique qui fonctionne bien en fonction de ce qu'on veut faire
3) faire profiter tout le monde de l'experience de chacun

J'explique mon problème :

j'ai une conf Nagios qui mélange contrôles passifs (NSCA) et actifs (plugins)
-> conf Nagios :
control actif available
control passif available

Pour les contrôles passifs, il faut contrôler le raffraichissement des données
control freshness available
-> template de service :
services actifs : control freshness : no
services passifs : control frechness : yes

Au resultat, j'ai quelques plugins actifs qui ne sont jamais lancés :
ils sont bien prévus dans le schedduler
à l'heure ou ils devraient être executés : Nagios ne fait rien
un peu plus tard, le scedduler les reprogramme à un temps ulterieur
ect ...
-> ils ne sont jamais executés ??


-> changement de conf : je force le check freshness pour tous les services
-> le scedduler est constement interrompu par le module check freshness pour executer tous les plugins.
Tous sont bien executés mais ce forcage fait dégringoler les perfs et rempli les logs Nagios de facon assez énorme...

-> test de la fonctions :
Orphaned Service Check Option -> yes, pas de changement très probant

Normalement, pour les services actifs, ils sont tous executés sans être obligé de définir le check freshness (doc Nagios) mais ca n'a pas l'air de très bien fonctionner ...

Qq un a-t-il eu le même problème ?
comment le résoudre ?

J'ai l'impression que pas mal de fonctions gèrenet de manière concurente le problème de l'ordonnencement et de vérification que tous les checks sont bien effecués sans vraiement se concerter ce qui fait que c'est un peu le bazard.

utilisation : nagios V2.8
nb hosts : 34
nb services monitorés : 200

cordialement,

gaé

gae
7th May 2007, 13:05
ma conf Nagios (nagios.conf) :



################################################## #################
# #
# GENERATED BY OREON #
# #
# Developped by : #
# - Julien Mathis #
# - Romain Le Merlus #
# #
# www.oreon-project.org #
# For information : contact@oreon-project.org #
################################################## #################

################################################## #################
# #
# Last modification May 4, 2007, 4:28 pm #
# By moi #
# #
################################################## #################

# 'nagios.cfg ODS'
# ODS + NSCA

cfg_file=/etc/nagios/hosts.cfg
cfg_file=/etc/nagios/services.cfg
cfg_file=/etc/nagios/misccommands.cfg
cfg_file=/etc/nagios/checkcommands.cfg
cfg_file=/etc/nagios/contactgroups.cfg
cfg_file=/etc/nagios/contacts.cfg
cfg_file=/etc/nagios/hostgroups.cfg
cfg_file=/etc/nagios/servicegroups.cfg
cfg_file=/etc/nagios/timeperiods.cfg
cfg_file=/etc/nagios/escalations.cfg
cfg_file=/etc/nagios/dependencies.cfg
cfg_file=/etc/nagios/hostextinfo.cfg
cfg_file=/etc/nagios/serviceextinfo.cfg
resource_file=/etc/nagios/resource.cfg
log_file=/var/log/nagios/nagios.log
object_cache_file=/var/log/nagios/objects.cache
temp_file=/var/log/nagios/nagios.tmp
status_file=/var/log/nagios/status.dat
p1_file=/usr/local/nagios/bin/p1.pl

aggregate_status_updates=1
status_update_interval=15

nagios_user=nagios
nagios_group=nagios

enable_notifications=1

execute_service_checks=1
accept_passive_service_checks=1
execute_host_checks=1
accept_passive_host_checks=0
enable_event_handlers=1

log_rotation_method=d
log_archive_path=/var/log/nagios/archives/

check_external_commands=1
command_check_interval=120s
command_file=/var/spool/nagios/cmd/nagios.cmd
downtime_file=/var/log/nagios/downtime.dat
comment_file=/var/log/nagios/comments.dat
lock_file=/var/run/nagios.pid

retain_state_information=0
state_retention_file=/var/log/nagios/retention.dat
retention_update_interval=60
use_retained_program_state=1
use_retained_scheduling_info=1

use_syslog=1
log_notifications=1
log_service_retries=1
log_host_retries=1
log_event_handlers=1
log_initial_states=0
log_external_commands=0
log_passive_checks=1

sleep_time=1
service_inter_check_delay_method=0.1
host_inter_check_delay_method=1
service_interleave_factor=s
max_concurrent_checks=0
max_service_check_spread=30
max_host_check_spread=30
service_reaper_frequency=10
interval_length=60

auto_reschedule_checks=0
auto_rescheduling_interval=30
auto_rescheduling_window=180

enable_flap_detection=1
low_service_flap_threshold=5.0
high_service_flap_threshold=20.0
low_host_flap_threshold=5.0
high_host_flap_threshold=20.0

service_check_timeout=60
host_check_timeout=30
event_handler_timeout=30
notification_timeout=30
ocsp_timeout=5
perfdata_timeout=5

obsess_over_services=0
obsess_over_hosts=0

process_performance_data=1
service_perfdata_command=process-service-perfdata
host_perfdata_file_mode=2
service_perfdata_file_mode=2

check_for_orphaned_services=1

check_service_freshness=1
service_freshness_check_interval=60
check_host_freshness=1
host_freshness_check_interval=60

date_format=euro

illegal_object_name_chars=`~!$%^&*|'"<>?,()=
illegal_macro_output_chars=`~$&|'"<>

use_regexp_matching=0
use_true_regexp_matching=0

admin_email=nagios-mail
admin_pager=nagios-pager


(en gras tout ce qui influe plus ou moins sur les perfs et les checks) ..