У меня есть кластер kafka (3 машины с 1 zookeeper и 1 брокером на каждой машине)
Я использую kafka_exporter для мониторинга потребительского показателя отставания, он нормально работает в обычном случае.
Но когда я убиваю 1 брокера, Прометей не может получить метрику от http://machine1:9308/metric (конечная точка метрики kafka_exporter), потому что для получения данных (1,5 м) требуется много времени, поэтому это будет тайм-аут.
Теперь, если я перезапущу kafka_exporter, я увижу ошибку:
Cannot get leader of topic __consumer_offsets partition 20: kafka server: In the middle of a leadership election, there is currently no leader for this partition and hence it is unavailable for writes
Когда я запускаю команду: kafka-themes.bat --describe --zookeeper machine1: 2181, machine2: 2181, machine3: 2181 --topic __consumer_offsets
Результат:
Topic:__consumer_offsets PartitionCount:50 ReplicationFactor:1 Configs:compression.type=producer,cleanup.policy=compact,segment.bytes=104857600
Topic: __consumer_offsets Partition: 0 Leader: -1 Replicas: 1 Isr: 1
Topic: __consumer_offsets Partition: 1 Leader: 2 Replicas: 2 Isr: 2
Topic: __consumer_offsets Partition: 49 Leader: 2 Replicas: 2 Isr: 2
Это ошибка конфигурации? И как я могу получить потребительское отставание в этом случае? «Лидер: -1» является ошибкой? если я остановлю машину 1 навсегда, она все равно будет работать нормально?