Я использую Apache Druid с контейнерным развертыванием HDFS на моем тестовом стенде.После стабильной работы в течение 5 дней я вижу, что один из рабочих HDFS в интерфейсе HDFS считается мертвым.Внутри контейнера этого «мертвого» работника я вижу, что процесс все еще жив, но в состоянии CLOSE_WAIT находятся тысячи TCP-соединений.Я вижу, что на странице HDFS JIRA было зарегистрировано немало проблем с различными версиями HDFS.
Версия HDFS: 2.7.5.
Ограничение контейнера: максимум 1048576 файлов.
Друид - единственный компонент, взаимодействующий с HDFS.Там не было написано никакого специального кода, который не смог бы вызвать close ().
Кто-нибудь видел подобную проблему и обходил ее?