У нас есть корпоративное приложение, размещенное на сервере JBOSS. На этом конкретном сервере есть четыре экземпляра, и наш код развернут на каждом из них.
Недавно у нас возникла проблема, когда один из четырех экземпляров перестал отвечать, и мы получили предупреждение об этом, перезапустив экземпляр вернул вещь обратно, но моему клиенту нужна root причина того, как экземпляр перестал отвечать.
У нас есть отдельная команда JBOSS, которая изучает проблемы с сервером, и они пытаются исправить проблему. команда заявки без уважительной причины. Мы (команда разработчиков) сообщаем, что одна и та же версия кода размещена на всех четырех экземплярах, у неотвечающего экземпляра не было скачков ни в ЦП, ни в памяти, тогда как можно винить команду приложения?
Есть ли что-нибудь, что мы можем попросить команду серверов проверить, что могло бы помочь им точно определить, что произошло в то время?
Журналы доступа не показывают никаких записей в течение этого периода времени, и журналы приложений тоже ничего не показывают .
Мы обратились к сетевой команде, и все, что они сказали, это то, что они пытались передать sh трафик c этому экземпляру сервера, но не смогли этого сделать, поскольку он не отвечал на их запросы. звонки.