HDAT datanode Большое количество TCP-соединений в состоянии CLOSE_WAIT - PullRequest
0 голосов
/ 01 октября 2018

Я использую Apache Druid с контейнерным развертыванием HDFS на моем тестовом стенде.После стабильной работы в течение 5 дней я вижу, что один из рабочих HDFS в интерфейсе HDFS считается мертвым.Внутри контейнера этого «мертвого» работника я вижу, что процесс все еще жив, но в состоянии CLOSE_WAIT находятся тысячи TCP-соединений.Я вижу, что на странице HDFS JIRA было зарегистрировано немало проблем с различными версиями HDFS.

Версия HDFS: 2.7.5.

Ограничение контейнера: максимум 1048576 файлов.

Друид - единственный компонент, взаимодействующий с HDFS.Там не было написано никакого специального кода, который не смог бы вызвать close ().

Кто-нибудь видел подобную проблему и обходил ее?

...