У нас есть несколько серверов wildfly 18, работающих автономно, но подключенных через очереди сообщений и кеши infinispan. Недавно у нас произошел сбой, и мы начали видеть эту ошибку на нескольких серверах:
12: 51: 08,437 ОШИБКА [org.infinispan.interceptors.impl.InvocationContextInterceptor] (timeout-thread-- p5-t1) ISPN000136: Ошибка при выполнении команды RemoveExpiredCommand в кэше «studiomanager», запись ключей [20003 $ 1860529424 $ 187762]: org.infinispan.util.concurrent.TimeoutException: ISPN000476: Истекло время ожидания ответов на запрос 7916397 от узла orfinispan. .remoting.transport.impl.SingleTargetRequest.onTimeout (SingleTargetRequest. java: 65) по адресу org.infinispan.remoting.transport.AbstractRequest.call (AbstractRequest. java: 87) по адресу org.infinispan.remotingbstractRensport. .call (AbstractRequest. java: 22) в java .util.concurrent.FutureTask.run (FutureTask. java: 266) [rt.jar: 1.8.0_181] в java .util.concurrent. ScheduledThreadPoolExecutor $ ScheduledFutureTask.access $ 201 (ScheduledThreadPoolExecutor. java: 180) [rt.jar: 1.8.0_181] в java .util.concurrent.ScheduledThreadPoo lExecutor $ ScheduledFutureTask.run (ScheduledThreadPoolExecutor. java: 293) [rt.jar: 1.8.0_181] в java .util.concurrent.ThreadPoolExecutor.runWorker (ThreadPoolExecutor. java: 1149) .0_181] в java .util.concurrent.ThreadPoolExecutor $ Worker.run (ThreadPoolExecutor. java: 624) [rt.jar: 1.8.0_181] в java .lang.Thread.run (Thread. java: 748) [rt.jar: 1.8.0_181]
Кажется довольно ясным, за исключением того, что кеш «studiomanager» определяется как локальный кеш. Он действительно использует продолжительность жизни / выселение, которая объясняет первую часть ошибки, но не вторую часть. Почему время ожидания локального кэша, по-видимому, истекает в ожидании другого сервера, как, кажется, показывает вторая часть ошибки?
У нас тоже есть реплицированные кеши, но это не один из них. Из автономного файла. xml:
<cache-container name="InfinispanSystem" default-cache="systemSettings">
<transport/>
<local-cache name="studiomanager"/>
<replicated-cache name="systemSettings">
<locking isolation="REPEATABLE_READ"/>
</replicated-cache>
</snip ...>
</cache-container>
Я искал что-нибудь, что отдаленно похоже на ту же проблему, но оказалось в основном пустым. Может ли кто-нибудь пролить свет на то, как и почему это могло произойти? 1015 * Серверы работают на docker, каждый из которых использует один и тот же образ, поэтому автономная конфигурация. xml в основном одинакова на всех из них. У нас есть несколько скриптов cli, которые вносят изменения в отдельные узлы, но подсистема Infinispan ими не затрагивается.