Я узнал, что по умолчанию структурированная потоковая передача поддерживает HDFSBackedStateStoreProvider
.Это означает, что вся информация о состоянии хранится в местоположении HDFS.
Гарантирует ли это, что в памяти не хранятся данные, которые могут вызвать длительные паузы ГХ?
Причина этого вопросато, что выполняемое мной задание останавливает обработку данных при большом объеме трафика и перехватывает данные через 15-20 минут задержки.