Announcement

Collapse
No announcement yet.

Arrêt broker/cbd sur serveur central

Collapse
X
 
  • Filter
  • Time
  • Show
Clear All
new posts

  • Arrêt broker/cbd sur serveur central

    Bonjour à tous,

    J'ai de nouveau quelques difficultés sur une architecture avec serveur central et deux satellites.

    Sur le serveur central, au bout d'un délai que je qualifierai d'aléatoire, le process/service cdb doit planter et n'est plus présent. Du coup, plus aucune information de la part des pollers n'est ajoutée dans la base de donnée principale.
    Ce problème semble apparaitre une à deux fois par jour et cela pourrait être corrélé à une mise à jour de la version 2.6 vers la 2.7 en CES car je n'avais pas ces soucis auparavent.



    J'ai configuré le broker en mode debug avec toutes les options de détails actives. Je ne constate rien de flagrant dans le logs ci ce n'est un poller qui s'est déconnecté inopinément. Une telle coupure peut elle provoquer l'arrêt brutal de cbd ?:
    Code:
    [1458728445] debug:   failover: endpoint 'central-broker-master-perfdata-output-failover' got event from normal source
    [1458728445] debug:   storage: 6 have not yet been acknowledged
    [1458728445] debug:   failover: endpoint 'central-broker-master-sql-output-failover' got event from normal source
    [1458728445] debug:   SQL: updating timestamp of instance 3 (1458728153)
    [1458728445] debug:   multiplexing: 0 events remaining in subcriber
    [1458728445] debug:   failover: endpoint 'centreon-broker-master-rrd-output-failover' got event from normal source
    [1458728445] debug:   BBDO: serializing event of type '65556'
    [1458728445] debug:   BBDO: event of type '65556' successfully serialized in 136 bytes
    [1458728445] debug:   TCP: write request of 136 bytes to peer 'localhost:5670'
    [1458728445] debug:   SQL: 3 events have not yet been acknowledged
    [B][1458728445] error:   BBDO: error while sending data to client: TCP peer '185.xx.xxx.xxx:51120' is disconnected[/B]
    [1458728445] debug:   TCP: write request of 53 bytes to peer '185.xxx.xxx.xxx:51120'
    Voici quelques informations complémentaires :
    Centreon Broker 2.11.3

    # rpm -qa | grep centr
    centreon-plugins-2.7.3-9.el6.noarch
    centreon-connector-ssh-1.1.2-1.el6.x86_64
    centreon-trap-2.7.3-9.el6.noarch
    centreon-connector-1.1.2-1.el6.x86_64
    centreon-plugin-meta-2.7.3-9.el6.noarch
    centreon-widget-graph-monitoring-1.3.0-3.el6.noarch
    centreon-broker-2.11.3-1.el6.x86_64
    centreon-engine-extcommands-1.5.0-10.el6.x86_64
    centreon-broker-cbd-2.11.3-1.el6.x86_64
    centreon-common-2.7.3-9.el6.noarch
    centreon-perl-libs-2.7.3-9.el6.noarch
    centreon-connector-perl-1.1.2-1.el6.x86_64
    centreon-web-2.7.3-9.el6.noarch
    centreon-2.7.3-9.el6.noarch
    centreon-broker-core-2.11.3-1.el6.x86_64
    centreon-engine-daemon-1.5.0-10.el6.x86_64
    centreon-engine-1.5.0-10.el6.x86_64
    centreon-broker-cbmod-2.11.3-1.el6.x86_64
    centreon-lang-fr_FR-2.7-2.el6.noarch
    centreon-widget-servicegroup-monitoring-1.3.0-4.el6.noarch
    centreon-widget-host-monitoring-1.4.2-1.el6.noarch
    centreon-base-config-centreon-engine-2.7.3-9.el6.noarch
    centreon-clib-1.4.2-1.el6.x86_64
    centreon-widget-hostgroup-monitoring-1.3.0-4.el6.noarch
    centreon-widget-service-monitoring-1.4.2-1.el6.noarch
    centreon-broker-storage-2.11.3-1.el6.x86_64


    Qu'en pensez vous ?
    Gui2

  • #2
    priori le timestamp dans le fichier de log correspond bien à la date d'arrêt des pollers.


    [[email protected] centreon-broker]# tail -n 10 central-broker-master.log-20160331
    [1459338902] debug: SQL: updating timestamp of instance 0 (1459338714)
    [1459338902] info: SQL: processing instance status event (id: 3, last alive: 1459338902)
    [1459338902] debug: BBDO: event of type '65552' successfully serialized in 62 bytes
    [1459338902] debug: TCP: write request of 62 bytes to peer 'localhost:5670'
    [1459338902] debug: multiplexing: 0 events remaining in subcriber
    [1459338902] debug: failover: endpoint 'central-broker-master-perfdata-output-failover' got event from normal source
    [1459338902] debug: storage: 3 have not yet been acknowledged
    [1459338902] debug: SQL: 3 events have not yet been acknowledged
    [1459338902] error: BBDO: error while sending data to client: TCP peer '185.xx.xx.xxx:52157' is disconnected
    [1459338902] debug: TCP: write request of 53 bytes to peer '185.xx.xx.xxx:52157'
    [[email protected] centreon-broker]# service cbd status
    cbd (pid 10601) en cours d'exécution...
    cbd est mort mais le fichier pid existe



    Je pense que le lien internet du satelitte (185.xx.xx.xxx) est arrivé à saturation et aurait provoqué une coupure. Un coupure de communication pendant les transfert d'information satellite -> central peut il induire un arret du broker ?

    Une idée concernant cela ?
    Attached Files

    Comment


    • #3
      Bonjour à tous,

      un nouveau crash de CBD hier en fin de journée :

      Code:
      [1459338902] error:   BBDO: error while sending data to client: TCP peer '185.xxx.xxx.xxx:52157' is disconnected
      [1459338902] debug:   TCP: write request of 53 bytes to peer '185.xxx.xxx.xxx:52157'

      Comment

      Working...
      X