Кафка хорошо подходит для этой проблемы?
Она будет работать с хранилищем, однако вы не упомянули о необходимости доступа к запросу.
Как определить объем оперативной памяти, необходимой для экземпляра Kafka Streams? Как определить объем дискового пространства, необходимого для RocksDB для каждого экземпляра Kafka Streams?
Похоже, вы просто храните данные, а не обрабатываете их, а хранилища постоянных состояний находятся в куче, поэтому начать с размера кучи по умолчанию и отслеживать его ...
Что касается хранилища, RocksDB - только опция по умолчанию - вы можете реализовать пользовательский поставщик хранилища состояний. Но вы можете определить UTF8 размер ваших строк и количество байтов в двойном, чтобы получить приблизительное представление о размере.
Есть ли какие-либо рекомендации по определению большого количества реплик, чтобы справиться с этой нагрузкой?
Реплики являются фактором доступности, а не обязательно загрузки ... Начните с 3- 5 реплик