У нас есть кластер Kafka из 5 брокеров (r5.xlarge).Вчера мы запустили наш производственный снимок базы данных, используя Debezium, который в основном выводит всю базу данных в темах Kafka.Я видел, что загрузка ЦП никогда не превышала 30% ни у одного из наших брокеров.Кроме того, в пике Network In было около 350 Мбит / с.
Сейчас, в полночь, один из наших брокеров вышел из строя из-за слишком большого количества исключений из открытых файлов, хотя я установил ulimit неограниченным во всех наших брокерах.Я не понимаю, что становится узким местом в этой установке.Это количество брокеров?или пропускная способность диска?или сеть?
У меня есть несколько идей:
- Увеличить число посредников.
- Использование нескольких каталогов данных на нескольких дисках?Повысит ли это пропускную способность диска?
- Использование сжатия тем.
Пожалуйста, помогите.