JBoss EAP 6.4 Проблема сети Infinispan Clustered cache - PullRequest
0 голосов
/ 01 мая 2020

У нас есть двухузловая кластерная среда JBoss, которая отлично работает в производственной среде. Периодически мы сталкиваемся с проблемой, когда 2 кэша перестают взаимодействовать друг с другом (мы не видим никаких журналов, связанных с бесконечностью, но мы замечаем журналы приложений, которые заключают, что кэши перестали взаимодействовать друг с другом). Чтобы решить эту проблему, мы временно отключили 1 узел. Затем через пару часов мы поднимаем другой узел, и он снова начинает работать правильно. Иногда этого не происходит, поэтому мы держим его закрытым еще какое-то время, а затем оно срабатывает в следующий раз, когда мы его поднимаем. Очень случайное поведение.
Нам кажется, что это прерывистый сетевой сбой. Поэтому нам нужно привлечь сетевую команду. Но я не понимаю, что мне им сказать.
Мой вопрос:
Какую конфигурацию необходимо проверить и как их можно проверить, чтобы убедиться, что кэши способны или не могут взаимодействовать друг с другом.

Мои настройки, связанные с кэшем, находятся в автономном режиме. xml:

<property name="ehcache.multicast.address" value="x.x.x.21"/>

<subsystem xmlns="urn:jboss:domain:jgroups:1.1" default-stack="udp">
            <stack name="udp">
                <transport type="UDP" socket-binding="jgroups-udp"/>
                <protocol type="PING"/>
                <protocol type="MERGE3"/>
                <protocol type="FD_SOCK" socket-binding="jgroups-udp-fd"/>
                <protocol type="FD"/>
                <protocol type="VERIFY_SUSPECT"/>
                <protocol type="pbcast.NAKACK"/>
                <protocol type="UNICAST2"/>
                <protocol type="pbcast.STABLE"/>
                <protocol type="pbcast.GMS"/>
                <protocol type="UFC"/>
                <protocol type="MFC"/>
                <protocol type="FRAG2"/>
                <protocol type="RSVP"/>
            </stack>
            <stack name="tcp">
                <transport type="TCP" socket-binding="jgroups-tcp"/>
                <protocol type="MPING" socket-binding="jgroups-mping"/>
                <protocol type="MERGE2"/>
                <protocol type="FD_SOCK" socket-binding="jgroups-tcp-fd"/>
                <protocol type="FD"/>
                <protocol type="VERIFY_SUSPECT"/>
                <protocol type="pbcast.NAKACK"/>
                <protocol type="UNICAST2"/>
                <protocol type="pbcast.STABLE"/>
                <protocol type="pbcast.GMS"/>
                <protocol type="UFC"/>
                <protocol type="MFC"/>
                <protocol type="FRAG2"/>
                <protocol type="RSVP"/>
            </stack>
        </subsystem>

 <socket-binding name="jgroups-mping" port="0" multicast-address="x.x.x.23" multicast-port="45700"/>
        <socket-binding name="jgroups-tcp" port="7600"/>
        <socket-binding name="jgroups-tcp-fd" port="57600"/>
        <socket-binding name="jgroups-udp" port="55200" multicast-address="x.x.x.24" multicast-port="45688"/>
        <socket-binding name="jgroups-udp-fd" port="54200"/>
        <socket-binding name="messaging" port="5445"/>
                <socket-binding name="messaging-group" port="0" multicast-address="x.x.x.22" multicast-port="${jboss.messaging.group.port:9876}"/>
                <socket-binding name="messaging-throughput" port="5455"/>
        <socket-binding name="modcluster" port="0" multicast-address="y.y.y.105" multicast-port="23364"/>```



Пожалуйста, дайте мне знать, если для выяснения проблемы требуется дополнительная информация. Спасибо.

Обновление от 8 мая 2020 года: включено DEBUG входит в org.infinispan и org.jgroups. Нашел эту строку в логах: 07: 17: 13,928 FINE [STABLE] (OOB-20, shared = udp) my-host-52 / ejb: получил дайджест от my-host-51 / ejb (digest = my-host- 51 / ejb: [4 (4)]), который не соответствует моему собственному дайджесту (my-host-52 / ejb: [0 (0)]): игнорирование дайджеста и повторная инициализация собственного дайджеста. Есть ли в этом смысл относиться к проблеме? Я вижу этот похожий журнал для всех кешей: hibernate / ejb / singleton.

1 Ответ

0 голосов
/ 06 мая 2020

Без журнала сложно понять, что происходит. Очевидно, что понижение org.jgroups до DEBUG может привести к чрезмерному ведению журнала, но это предоставит некоторую важную информацию.

...