В настоящее время я пытаюсь управлять кластером openmq (с glassfish 3.0.1) и сталкиваюсь со странным поведением.
Кластер работает уже семь месяцев без проблем с 2 зарегистрированными брокерами.
Теперь мне нужно временно добавить еще двух брокеров в кластер. Вот что я имею раньше:
-------------------------
Host Primary Port
-------------------------
localhost 7676
Cluster ID MyCluster
Cluster is Highly Available true
-------------------------------------------------------------------------------------------------------------
ID of broker Time since last
Broker ID Address State Msgs in store performing takeover status timestamp
-------------------------------------------------------------------------------------------------------------
Broker1 192.168.0.1:7676 OPERATING 5 6 seconds
Broker2 192.168.0.2:7676 OPERATING 8 6 seconds
Затем я успешно запустил двух других брокеров на двух других серверах и получил:
-------------------------
Host Primary Port
-------------------------
localhost 7676
Cluster ID MyCluster
Cluster is Highly Available true
-------------------------------------------------------------------------------------------------------------
ID of broker Time since last
Broker ID Address State Msgs in store performing takeover status timestamp
-------------------------------------------------------------------------------------------------------------
Broker1 192.168.0.1:7676 OPERATING 5 6 seconds
Broker2 192.168.0.2:7676 OPERATING 8 6 seconds
Broker3 192.168.0.3:7676 OPERATING 5 6 seconds
Broker4 192.168.0.4:7676 OPERATING 8 6 seconds
Приложение хорошо работает с конфигурацией, автоматически используя двух новых посредников. Проблема возникает, когда я останавливаю посредника из кластера с помощью следующей команды:
./imqcmd shutdown bkr
на одном из серверов. Результат ./imqcmd list bkr
следующий:
-------------------------
Host Primary Port
-------------------------
localhost 7676
Cluster ID MyCluster
Cluster is Highly Available true
-------------------------------------------------------------------------------------------------------------
ID of broker Time since last
Broker ID Address State Msgs in store performing takeover status timestamp
-------------------------------------------------------------------------------------------------------------
Broker1 192.168.0.1:7676 OPERATING 5 6 seconds
Broker2 192.168.0.2:7676 OPERATING 8 6 seconds
Broker3 192.168.0.3:7676 TAKEOVER_COMPLETE 0 Broker1 6 seconds
Broker4 192.168.0.4:7676 OPERATING 8 6 seconds
Кажется, все в порядке, захват выполняется Broker1, но когда я смотрю на server.log стеклянных рыбок, я обнаружил следующую строку:
[C4003]: Error occurred on connection creation [192.168.0.3:7676]. - cause: java.net.ConnectException: Connection refused|#]
Например, если стеклянная рыба попытается подключиться к брокеру с выключенным пухом.
Я что-то пропустил?
Спасибо за вашу помощь.