Announcement

Collapse
No announcement yet.

Pas de mise à jour des équipements / no devices updates

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Pas de mise à jour des équipements / no devices updates

    Bonjour à tous, J'ai un léger souci avec mon duo nagios/centreon. J'utilise le centreon 2.5.0 de Merethis, tout allait bien jusqu'à vendredi dernier. Nous avons eu une panne électrique majeure sur le site à monitorer, si bien que la moitié des équipements sont passés hors ligne. Centreon ne nous a pas averti car le serveur mail est tombé. Mais depuis que nous avons redémarré nos machines, centreon reste bloqué sur sa dernière vérification du vendredi à 7H35, heure de la panne. Ces équipements ne sont plus du tout monitorés (erreurs snmp, pas de ping, etc) alors qu'ils fonctionnent parfaitement. Même Centreon peut les pinguer lorsque je force la vérification, mais leur état ne change pas dans l'interface. Je lui ai laissé trois jours pour changer d'avis et se mettre à la page, mais rien. Ce que j'ai fait depuis: - Tenté d'acquitter les problèmes: aucun résultat, les serveurs tombés sont toujours marqués comme injoignables alors qu'ils le sont. Je reçois bien le mail comme quoi c'est acquitté, mais pas d'évolution. - Tenté de redémarrer l'ordonnanceur --> rien - Redémarré carrément le redhat linux qui héberge le tout: pas d'évolution. Si quelqu'un à une solution ou une expérience similaire, ça serait sympatoche, merci Hi, I've got a tiny problem with my centreon/nagios. I'm using Centreon 2.5.0 by Merethis. Everything looks OK until 2015-02-01, Friday: we experienced a major electric failure, so half of our servers went down. When we get them back up, centreon did not detect it. Last verifications for the concerned servers are Friday, 7:35am, and centreon didn't check this servers until this time. However, centreon can ping them when I force it to do a ping with integrated utils, but this not change the server's state. All of our server are running normally and there was no IP adress change. I've made some actions: - Restart the "ordonnancer" --> no effect. - Acknowledge problems --> I've got the acknoledgement mails but no change within centreon's interface - Restart the redhat linus host --> no effect. If someone has experienced same problems, It will be very nice to you to explain me what can I do! Many thanks!

  • #2
    Bonjour,

    Pourriez-vous vérifier les fichiers de logs de ndo2db et les fichiers de logs de votre base de données ?

    Cordialement.
    /!\Pas de support en message privé - No support in private message/!\

    "Il se faut entraider, c'est la loi de la nature." © Jean de La Fontaine

    Comment


    • #3
      Quel fichier vous intéresse en particulier? CentCore.log? [[email protected] centreon]# ls centAcl.log dashboardBuilder.log logAnalyser.log rrdtool.log centcore.log downtimeManager.log login.log sql-error.log centreon-purge.log eventReportBuilder.log nagiosPerfTrace.log [[email protected] centreon]# more centcore.log 2014-09-23 08:52:21 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2014-09-23 08:52:21 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2014-09-23 08:52:21 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2014-09-23 08:52:21 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2014-09-23 08:52:21 - Error when getting server properties 2015-01-02 19:15:05 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-02 19:15:05 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-02 19:15:05 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-02 19:15:05 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-02 19:15:05 - Error when getting server properties 2015-01-05 09:45:23 - Ip address not defined for poller 2015-01-05 09:51:30 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-05 09:51:30 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-05 09:51:30 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-05 09:51:30 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-05 09:51:30 - Error when getting server properties

      Comment


      • #4
        Bonsoir, merci de votre réponse, Y a t-il des logs qui vous intéressent plus particlulièrement parmis ceux ci? [[email protected] centreon]# ls centAcl.log dashboardBuilder.log logAnalyser.log rrdtool.log centcore.log downtimeManager.log login.log sql-error.log centreon-purge.log eventReportBuilder.log nagiosPerfTrace.log Note: j'ai posté une réponse ce matin mais je n'avais pas vu qu'elle n'étais pas passée. Il y a des limitations de taille?

        Comment


        • #5
          Bonjour,

          Il y a effectivement certaines limitations. Je vous conseille donc de passer par un site comme celui-ci : https://framalab.org/zerobin/
          Autrement les messages d'erreurs sont assez explicites. Vous avez un souci avec votre base de données. Vérifiez que vous n'ayez pas de table crashée.

          Cordialement.
          /!\Pas de support en message privé - No support in private message/!\

          "Il se faut entraider, c'est la loi de la nature." © Jean de La Fontaine

          Comment


          • #6
            J'ai ces erreurs plusieurs fois de suite à des heures différentes à partir de la reprise du ciourant (15H), mais au vu de la base SQL rien n'est effondré... les bases sont opérationnelles, les services SNMP sont activés sur les équipements distants... 2015-01-02 19:15:05 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c aller: centreon::common::db:/usr/share/perl5/vendor_perl/centreon/common/db.pm:2 66) 2015-01-02 19:15:05 - Error when getting server properties 2015-01-05 09:45:23 - Ip address not defined for poller 2015-01-05 09:51:30 - MySQL error : cannot connect to database centreon: Can't c onnect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (111) (c

            Comment


            • #7
              Bonjour, Après arrêt manuel du SQL, et de centreon, et d'un redémarrage d'abord de SQL puis ensuite de centreon, les choses se sont remises en place. Je crois qu'en fait la base de données démarre après centreon et ce dernier ne la trouve pas. Mais il est bien un peu stupide quand même... 3 jours à être en panne. Anyway, tout est revenu à la normale, mais c'est quand même regrettable que centreon ne supporte que très mal les arrêts non-programmés Merci de l'aide en tout cas!

              Comment


              • #8
                Bonjour à tous,

                J'ai moi aussi un prolème dans ce genre. j'ai ce genre d'alarme sur mon centreon:
                BCRNANOGWMGT02-ADM ESX_MEMORY_Usage Critique 10.224.171.17 3M 4w 2d 8m 58s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWPRI02-ADM ESX_NET_Interface-Status Critique 10.224.171.21 3M 4w 2d 9m 24s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWMGT01-ADM ESX_SERVICE_Status Critique 10.224.171.15 3M 4w 2d 10m 44s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWPUB02-ADM ESX_SERVICE_Status Critique 10.224.171.25 3M 4w 2d 12m 2s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWPUB01-ADM ESX_CPU_Usage Critique 10.224.171.23 3M 4w 2d 12m 14s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWMGT01-ADM ESX_MEMORY_Usage Critique 10.224.171.15 3M 4w 2d 12m 28s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                BCRNANOGWPUB02-ADM ESX_NET_Traffic Critique 10.224.171.25 3M 4w 2d 12m 34s 01/11/2014 16:27 (Return code of 127 is out of bounds - plugin may be missing)
                ces alarmes ne sont pas d'actualités car nous sommes le 22 jan 2015. Quelques minutes après elle disparaisent et redeviennent OK. et cela ne fait que se repeter depuis maintenant plus d'une semaine.
                j'ai verifier le nagios tout me semble ok. Voici un extrait des données dans le log du nagios
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_CPU_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - cpu usage=3.41 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_DISK_IO-Read;OK;HARD;1;CHECK_VMWARE_API.PL OK - io read latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_DISK_IO-Write;OK;HARD;1;CHECK_VMWARE_API.PL OK - io write latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_MEMORY_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - mem usage=46.96 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_NET_Interface-Status;OK;HARD;1;CHECK_VMWARE_API.PL OK - All 4 NICs are connected
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_NET_Traffic;OK;HARD;1;CHECK_VMWARE_API.PL OK - net usage=3.00 KBps
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_SERVICE_Status;OK;HARD;1;CHECK_VMWARE_API. PL OK - All services are in their apropriate state.
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPRI02-ADM;ESX_SWAP;OK;HARD;1;CHECK_VMWARE_API.PL OK - swap usage=0.00 MB
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_CPU_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - cpu usage=2.66 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_DISK_IO-Read;OK;HARD;1;CHECK_VMWARE_API.PL OK - io read latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_DISK_IO-Write;OK;HARD;1;CHECK_VMWARE_API.PL OK - io write latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_MEMORY_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - mem usage=39.33 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_NET_Interface-Status;OK;HARD;1;CHECK_VMWARE_API.PL OK - All 4 NICs are connected
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_NET_Traffic;OK;HARD;1;CHECK_VMWARE_API.PL OK - HOST NET Unknown error
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_SERVICE_Status;OK;HARD;1;CHECK_VMWARE_API. PL OK - All services are in their apropriate state.
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB01-ADM;ESX_SWAP;OK;HARD;1;CHECK_VMWARE_API.PL OK - swap usage=0.00 MB
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_CPU_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - cpu usage=8.21 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_DISK_IO-Read;OK;HARD;1;CHECK_VMWARE_API.PL OK - io read latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_DISK_IO-Write;OK;HARD;1;CHECK_VMWARE_API.PL OK - io write latency=0 ms
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_MEMORY_Usage;OK;HARD;1;CHECK_VMWARE_API.PL OK - mem usage=38.27 %
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_NET_Interface-Status;OK;HARD;1;CHECK_VMWARE_API.PL OK - All 4 NICs are connected
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_NET_Traffic;OK;HARD;1;CHECK_VMWARE_API.PL OK - net usage=15.00 KBps
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_SERVICE_Status;OK;HARD;1;CHECK_VMWARE_API. PL OK - All services are in their apropriate state.
                [1421928000] CURRENT SERVICE STATE: BCRNANOGWPUB02-ADM;ESX_SWAP;OK;HARD;1;CHECK_VMWARE_API.PL OK - swap usage=0.00 MB


                je n'arrive pas à comprendre pourquoi ce bagot d'alarmes. Quelqu'un pourrait m'aider s'il vous plait?

                Comment

                Working...
                X