KTable поддерживается темой, поэтому он будет определять, каковы его политики хранения и очистки.
Если политика очистки compact
, то каждый уникальный ключ хранится «навсегда» или до тех пор, пока у брокера не закончится свободное место, в зависимости от того, что произойдет раньше.
Если вы запускаете несколько экземпляров, то каждый KTable будет хранить подмножество данных из разделов, из которых он потреблял, в каждой таблице не будет всех данных.
В случае сбоя какого-либо экземпляра ему нужно будет прочитать все данные с начала его раздела журнала изменений, но вы можете настроить резервные реплики для учета этого сценария
Дополнительная информация на https://cwiki.apache.org/confluence/display/KAFKA/Kafka+Streams+Internal+Data+Management