Announcement

Collapse
No announcement yet.

le CPU monte exponentiellement

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • le CPU monte exponentiellement

    Je suis sous Nagios 2.6 et Oreon 1.4 avec tout les derniers patchs installés.
    Je suis sous Debian

    J'ai installé Nagios depuis 5 mois à la main, avec les fichiers de conf, et aucun soucis. Envois de mail ok.

    depuis un mois j'ai installé Oreon. Il y a deux semaines je me suis rendu compte que les processus Sendmail et sendmail-mta tournaient à fond en CPU mais sans envoyer de mail.

    J'ai regardé les notifications nagios : aucune notification

    les mails en queue augmenté dans /var/spool/mqueue

    Je me suis di que c'était peut-être sendmail qui bugué, donc je l'ai désinstallé et j'ai mi Postfix (plus simple). Mais pareil avec Postfix.

    Voici n bout des logs de /var/log/syslog où l'on voit (clairement) que c'est le script cron d'oreon qui est à l'initiative d'un bombardement de mails!!:eek:
    Code:
    May 31 14:29:05 ap2009 postfix/local[3344]: C3CD0680FE: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=303, delays=262/41/0/0.09, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:29:05 ap2009 postfix/qmgr[2513]: C3CD0680FE: removed
    May 31 14:29:05 ap2009 postfix/local[3451]: 7D40867EAE: to=<[email protected]lhost.localdomain>, orig_to=<nagios>, relay=local, delay=2.8, delays=0.2/2.6/0/0.07, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:29:05 ap2009 postfix/qmgr[2513]: 7D40867EAE: removed
    May 31 14:29:05 ap2009 postfix/local[3344]: 9329767E54: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=2.9, delays=0.25/2.6/0/0.14, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:29:05 ap2009 postfix/qmgr[2513]: 9329767E54: removed
    May 31 14:29:10 ap2009 postfix/local[3603]: 74306680DB: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=1029, delays=981/39/0/8.7, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:29:10 ap2009 postfix/qmgr[2513]: 74306680DB: removed
    May 31 14:30:01 ap2009 /USR/SBIN/CRON[3751]: (nagios) CMD (/etc/oreon/cron/parsing_log.pl >> /etc/oreon/log/ods_parsing_log 2>> /etc/oreon/log/ods_parsing_log)
    May 31 14:30:01 ap2009 /USR/SBIN/CRON[3753]: (nagios) CMD (/etc/oreon/cron/parsing_status.pl >> /etc/oreon/log/ods_parsing_status 2>> /etc/oreon/log/ods_parsing_status)
    May 31 14:30:01 ap2009 postfix/pickup[2514]: A8A4F67EAE: uid=104 from=<nagios>
    May 31 14:30:01 ap2009 postfix/cleanup[2918]: A8A4F67EAE: message-id=<[email protected]>
    May 31 14:30:01 ap2009 postfix/qmgr[2513]: A8A4F67EAE: from=<[email protected]>, size=730, nrcpt=1 (queue active)
    May 31 14:30:01 ap2009 postfix/pickup[2514]: B001667E54: uid=104 from=<nagios>
    May 31 14:30:01 ap2009 postfix/cleanup[2916]: B001667E54: message-id=<[email protected]>
    May 31 14:30:01 ap2009 postfix/qmgr[2513]: B001667E54: from=<[email protected]>, size=742, nrcpt=1 (queue active)
    May 31 14:30:01 ap2009 postfix/local[3451]: A8A4F67EAE: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=0.11, delays=0.06/0/0/0.05, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:30:01 ap2009 postfix/qmgr[2513]: A8A4F67EAE: removed
    May 31 14:30:09 ap2009 postfix/local[3344]: B001667E54: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=8.1, delays=0.09/0/0/8, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:30:09 ap2009 postfix/qmgr[2513]: B001667E54: removed
    May 31 14:31:01 ap2009 /USR/SBIN/CRON[3774]: (nagios) CMD (/etc/oreon/cron/parsing_log.pl >> /etc/oreon/log/ods_parsing_log 2>> /etc/oreon/log/ods_parsing_log)
    May 31 14:31:01 ap2009 /USR/SBIN/CRON[3776]: (nagios) CMD (/etc/oreon/cron/parsing_status.pl >> /etc/oreon/log/ods_parsing_status 2>> /etc/oreon/log/ods_parsing_status)
    May 31 14:31:01 ap2009 postfix/pickup[2514]: C2BD467EB1: uid=104 from=<nagios>
    May 31 14:31:01 ap2009 postfix/cleanup[2918]: C2BD467EB1: message-id=<[email protected]>
    May 31 14:31:01 ap2009 postfix/qmgr[2513]: C2BD467EB1: from=<[email protected]>, size=730, nrcpt=1 (queue active)
    May 31 14:31:01 ap2009 postfix/pickup[2514]: C939767E54: uid=104 from=<nagios>
    May 31 14:31:01 ap2009 postfix/cleanup[2916]: C939767E54: message-id=<[email protected]>
    May 31 14:31:01 ap2009 postfix/qmgr[2513]: C939767E54: from=<[email protected]>, size=742, nrcpt=1 (queue active)
    May 31 14:31:01 ap2009 postfix/local[3451]: C2BD467EB1: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=0.12, delays=0.05/0/0/0.06, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:31:01 ap2009 postfix/qmgr[2513]: C2BD467EB1: removed
    May 31 14:31:01 ap2009 postfix/local[3344]: C939767E54: to=<[email protected]>, orig_to=<nagios>, relay=local, delay=0.15, delays=0.1/0/0/0.05, dsn=2.0.0, status=sent (delivered to command: procmail -a "$EXTENSION")
    May 31 14:31:01 ap2009 postfix/qmgr[2513]: C939767E54: removed
    May 31 14:31:29 ap2009 postfix/scache[2744]: statistics: start interval May 31 14:28:09
    May 31 14:31:29 ap2009 postfix/scache[2744]: statistics: domain lookup hits=0 miss=1 success=0%
    May 31 14:31:29 ap2009 postfix/scache[2744]: statistics: address lookup hits=0 miss=1 success=0%
    May 31 14:31:29 ap2009 postfix/scache[2744]: statistics: max simultaneous domains=1 addresses=1 connection=1
    May 31 14:32:01 ap2009 /USR/SBIN/CRON[3808]: (nagios) CMD (/etc/oreon/cron/parsing_status.pl >> /etc/oreon/log/ods_parsing_status 2>> /etc/oreon/log/ods_parsing_status)
    May 31 14:32:01 ap2009 /USR/SBIN/CRON[3810]: (nagios) CMD (/etc/oreon/cron/parsing_log.pl >> /etc/oreon/log/ods_parsing_log 2>> /etc/oreon/log/ods_parsing_log)
    May 31 14:32:01 ap2009 postfix/pickup[2514]: DF3E467EB1: uid=104 from=<nagios>
    May 31 14:32:01 ap2009 postfix/cleanup[2918]: DF3E467EB1: message-id=<[email protected]>
    May 31 14:32:01 ap2009 postfix/qmgr[2513]: DF3E467EB1: from=<[email protected]>, size=742, nrcpt=1 (queue active)
    May 31 14:32:01 ap2009 postfix/pickup[2514]: E6E6C67E54: uid=104 from=<nagios>
    May 31 14:32:01 ap2009 postfix/cleanup[2916]: E6E6C67E54: message-id=<[email protected]>
    May 31 14:32:01 ap2009 postfix/qmgr[2513]: E6E6C67E54: from=<[email protected]>, size=730, nrcpt=1 (queue active)
    May 31 14:32:02 ap2009 postfix/local[3344]: E6E6C67E54: to=<[email protected]>, orig_to=<nagios>, relay=local, d
    Et plus en profondeur..
    Si j'ouvre un mail qui s'est mis dans /var/spool/mqueue voila ce qu'il est sensé envoyer :

    Code:
    --l4QC2dIZ002624.1180182533/ap2009.XXXXXXXXXX.fr
    
        **********************************************
        **      THIS IS A WARNING MESSAGE ONLY      **
        **  YOU DO NOT NEED TO RESEND YOUR MESSAGE  **
        **********************************************
    
    The original message was received at Thu, 24 May 2007 17:34:03 +0200
    from localhost.localdomain [127.0.0.1]
    
       ----- Transcript of session follows -----
    451 4.0.0 putbody: write error: Broken pipe
    451 4.0.0 Operating system error
    Warning: message still undelivered after 4 hours
    Will keep trying until message is 5 days old
    
    --l4QC2dIZ002624.1180182533/ap2009.XXXXXXXXXXXXXX.fr
    Content-Type: message/delivery-status
    
    Reporting-MTA: dns; ap2009.XXXXXXXXXXXXXXXXX.fr
    Arrival-Date: Thu, 24 May 2007 17:34:03 +0200
    
    Final-Recipient: RFC822; [email protected]
    Action: delayed
    Status: 4.5.0
    Diagnostic-Code: X-Unix; 71
    Last-Attempt-Date: Sat, 26 May 2007 14:28:53 +0200
    Will-Retry-Until: Tue, 29 May 2007 17:34:03 +0200
    
    --l4QC2dIZ002624.1180182533/ap2009.XXXXXXXXXXXXXXXXXXXXX.fr
    Content-Type: text/rfc822-headers
    Content-Transfer-Encoding: 8bit
    
    Return-Path: <[email protected]>
    Received: from ap2009.XXXXXXXXXXXXXXXXXXX.fr (localhost.localdomain [127.0.0.1])
            by ap2009.XXXXXXXXXXXXXXXX.fr (8.13.8/8.13.8/Debian-3) with ESMTP id l4OFXjrh003270
            for <[email protected]>; Thu, 24 May 2007 17:34:03 +0200
    Received: (from [email protected])
            by ap2009.XXXXXXXXXX.fr (8.13.8/8.13.8/Submit) id l4OFM17P032251
            for nagios; Thu, 24 May 2007 17:22:01 +0200
    Date: Thu, 24 May 2007 17:22:01 +0200
    Message-Id: <[email protected]>
    From: [email protected] (Cron Daemon)
    To: [email protected]
    Subject: Cron <[email protected]> /etc/oreon/cron/parsing_status.pl >> /etc/oreon/log/ods_parsing_status 2>> /etc/oreon/log/ods_parsing_status
    Content-Type: text/plain; charset=ANSI_X3.4-1968
    X-Cron-Env: <SHELL=/bin/sh>
    X-Cron-Env: <HOME=/var/run/nagios2>
    X-Cron-Env: <PATH=/usr/bin:/bin>
    X-Cron-Env: <LOGNAME=nagios>
    
    --l4QC2dIZ002624.1180182533/ap2009.XXXXXXXXXX.fr--
    Merci de votre attention,

    Vincent
    Nagios 2.6 - Oreon 1.4.2.3 - RRDtool 1.2.19 - PHPWeathermap 1.2.3 - Status Map 1.0
    OS: Debian r3 sur VMware.

  • #2
    précisions

    Les mails 'normaux" d'alerte sont bien envoyé au serveur exchange et bien recu par les admins.
    Le problème est juste ce spam, qui me prend tout mon CPU avec les daemons:
    -qmgr
    -cleanup
    -local
    -kjournald
    ...

    Un grand merci de votre interet car je désespére depuis 2 semaines sur ce probleme
    Nagios 2.6 - Oreon 1.4.2.3 - RRDtool 1.2.19 - PHPWeathermap 1.2.3 - Status Map 1.0
    OS: Debian r3 sur VMware.

    Comment


    • #3
      début de résolution!!

      bon, après avoit passsé encore pas mal de temps dessus et surtout en réussissant à me connecter en nagios

      su -s /bin/sh nagios

      puis je me suis rendu compte qu'oreon n'arrivait pas à acceder au fichier de log de nagios:

      il essayer d'y accéder à /srv/nagios/var/nagios.log

      donc bon j'ai copier mon fichier de log

      cp /var/nagios2/log/nagios.log /srv/nagios/var/nagios.log

      Mais l'utilisateur nagios n'arrivait toujours pas executer le script donc un petit chmod.

      et la youpi en relancant postfix il a vidé ses fichiers et à redescendu en cpu.

      bon je ne sais toujours pas pouquoi il cherche dans /srv/nagios/var/nagios.log

      je l'ai trouvé dans createTablesODS.sql mais je ne sais pas encore si je dois le changer :confused: :confused:

      En tous cas merci quand meme de votre lecture...

      Vincent
      Nagios 2.6 - Oreon 1.4.2.3 - RRDtool 1.2.19 - PHPWeathermap 1.2.3 - Status Map 1.0
      OS: Debian r3 sur VMware.

      Comment


      • #4
        Oreon essaye d'acceder au fichier de log pour le repporting. Copier le fichier n'est pas une bonne solution car se fichier evolue tout le temps.
        Va plutot changer le chemin dans Option=> Options Generales=>OreonDataStorage=> Fichier de log de nagios à parser
        Oreon 1.4
        Nagios 2.9
        RRDTool 1.2.18

        Comment


        • #5
          OK merci j'ai changé le chemin pour le fichier de log de nagios

          par contre le chemin d'accès aux la base rdd de stockage est : /srv/oreon/OreonDataStorage/

          mais ce répertoire n'existe pas sur ma Debian

          Es ce que vous auriez une idée de ce que je dois mettre comme répertoire ?:confused:
          Nagios 2.6 - Oreon 1.4.2.3 - RRDtool 1.2.19 - PHPWeathermap 1.2.3 - Status Map 1.0
          OS: Debian r3 sur VMware.

          Comment


          • #6
            A mon avis il faut mettre /usr/local/oreon/OreonDataStorage/
            Mais verifie que ce repertoire existe avant de changer quoi que ce soit
            Oreon 1.4
            Nagios 2.9
            RRDTool 1.2.18

            Comment

            Working...
            X