Я хочу описать следующий случай, который был на одном из наших производственных кластеров
У нас есть кластер ambari с HDP версии 2.6.4
Кластер включает в себя 3 машины kafka - в то время как каждый kafka имеетдиск с 5 T
Мы увидели, что все диски kafka были размером 100%, поэтому диск kafka был переполнен, и это является причиной сбоя всех брокеров kafka
df -h /kafka
Filesystem Size Used Avail Use% Mounted on
/dev/sdb 5T 5T 23M 100% /var/kafka
ПослеВ результате расследования мы увидели, что log.retention.hours=7 days
Так что кажется, что чистка происходит через 7 дней, и, возможно, это причина того, что диски kafka заполнены на 100%, даже если они огромные - 5T
Что мыхочу сделать сейчас - это как избежать этого случая в будущем?
Итак
Мы хотим знать - как избежать использования полной емкости на дисках kafka
Что мынужно установить в конфиге Kafka, чтобы очистить диск kafka в соответствии с размером диска - возможно ли это?
А как узнать правильное значение log.retention.hours
?в зависимости от размера диска или другого?