Я хочу поделиться всем о нашем случае.
У нас есть кластер oop с 2 именными узлами, одним активным именным узлом и одним резервным именным узлом.
Через некоторое время мы замечаем, что активный узел имени и вторичный узел имени не работают в течение 3 дней.
После просмотра файлов журнала узла имени мы видим, что вторичный узел имени был недоступен в течение 1 месяца, и активный узел имени остановился на пару часов.
Другая интересная вещь, которую мы видим в журнале активного узла имен, это проблема размера кучи узла имен, как, возможно, некоторые из вас знают, что вторичный узел имени фактически поддерживает активный узел имени, но вторичный узел имени не заменяет активный узел имени.
Поэтому мы предполагаем, что причина отказа активного узла имени в том, что активный узел имени не получил подтверждение данных от вторичного узла имени, и, возможно, это является причиной высокого потребления JVM из активного имени узла.
Я буду признателен за стек Помощь пользователям потока, и ваше мнение о нашем деле