Среда: HDP 2.6.4
Амбари - 2.6.1
3 сервера zookeeper
23.1.35.185 - это IP первого сервера zookeeper
hi all,
В первом сервере zookeeper кажется, что даже после закрытия соединения сzookeeper не закрывается,
, что приводит к достижению максимального количества клиентских подключений с хоста - у нас maxClientCnxns равно 60 в конфигурации zookeeper
В результате, когда приходит новое приложение ипытается создать соединение, но не удается.
Пример, когда Соединения:
echo stat | nc 23.1.35.185 2181
Latency min/avg/max: 0/71/399
Received: 3031 Sent: 2407
Connections: 67
Outstanding: 622
Zxid: 0x130000004d
Mode: follower
Node count: 3730
Но через некоторое время, когда соединение достигает ~ 70, мы видим
echo stat | nc 23.1.35.185 2181
Ncat: Connection reset by peer.
ИМы также можем видеть много CLOSE_WAIT
java 58936 zookeeper 60u IPv6 381963738 0t0 TCP Zookeper_server.sys54.com:eforward->zookeper_server.sys54.com:44983 (CLOSE_WAIT)
Из журнала зоопарка
2018-12-26 02:50:46,382 [myid:1] - WARN [NIOServerCxn.Factory:0.0.0.0/0.0.0.0:2181:NIOServerCnxnFactory@193]
- Too many connections from /23.1.35.185 - max is 60
В амбари мы также можем видеть
Connection failed: [Errno 104] Connection reset by peer to zookeper_server.sys54.com.:2181
Я должен сказать, что этоне происходит на серверах zookeeper 2 и 3
ПРИМЕЧАНИЕ - если мы увеличим maxClientCnxns до 300, это не помогает, потому что через некоторое время мы получаем больше 300 соединений (CLOSE_WAIT), а затем видим из журнала
2018-12-26 02:50:49,375 [myid:1] - WARN [NIOServerCxn.Factory:0.0.0.0/0.0.0.0:2181:NIOServerCnxnFactory@193] - Too many connections from /23.1.35.187 - max is 300
, так есть ли какой-нибудь намек, почему соединение CLOSE_WAIT?