Вы можете проверить Состояние потоков Кафки , чтобы проверить, выполняется ли это перебалансирование / запуск, что указывает на исправность операций. Хотя, если в топологию не поступает никаких данных, я бы предположил, что ошибок не будет, поэтому вам нужно проверить работоспособность зависимостей вверх по течению.
В целом, может показаться, что вы захотите потратить некоторое время на использование инструментов мониторинга, таких как Consul или Sensu, которые могут выполнять локальные проверки работоспособности служб и отправлять оповещения, когда службы go отключены. Или, по крайней мере, Предупреждение Elasticseach
Что касается проверки работоспособности Kafka, вы можете сделать это несколькими способами
- Работает ли процесс брокера и zookeeper ? (S SH к узлу, проверьте процессы)
- Открыты ли порты брокера и zookeeper? (используйте Socket-соединение)
- Существуют ли важные метрики JMX, которые вы можете отслеживать? ( Metricbeat )
- Можете ли вы найти активного брокера Контроллера (используйте
AdminClient#describeCluster
) - Есть ли необходимое минимальное количество брокеров, на которое вы хотели бы ответить как часть метаданные контроллера (которые можно получить из
AdminClient
) - Имеют ли темы, которые вы используете, правильную конфигурацию? (срок хранения, минимальный ресурс, коэффициент репликации, количество разделов и т. д. c)? (снова используйте
AdminClient
)