Странный мониторинг состояния кластера Кафки - PullRequest
0 голосов
/ 19 июня 2019

У меня кластер 3 узла Kafka на AWS .Чтобы убедиться, что кластер Kafka работает правильно, я добавил скрипт мониторинга, который периодически опрашивает количество доступных узлов Kafka (это делается с помощью команды Zookeeper CLI с именем ls /brokers/ids, подсчитывается количество возвращаемых идентификаторов) исообщает об этом AWS Cloudwatch .

Я ожидаю, что это число всегда будет равно размеру кластера, если кластер исправен, и это почти всегда так.Но один раз в день в течение короткого периода времени (5-15 минут) команда Zookeeper CLI возвращает менее 3 узлов, иногда 1, а иногда 2, и вскоре после этого возвращается к нормальному размеру 3 узлов..

Я пытаюсь выяснить, является ли это нормальным поведением, возможно, происходит какое-то переизбрание или другой внутренний процесс, и узлы по какой-то причине перерегистрируются.Или я столкнулся с какой-то проблемой с моим кластером Kafka?

...