Я выполняю какую-то обработку в spark и хочу реализовать функциональность, которая независимо от выполняемой обработки, я хочу запланировать таймер (с интервалом в 5 минут), который будет сохранять некоторые данные в Cassandra (или позволитьскажем, любой другой источник)
Чтобы сделать его более простым для понимания, это может звучать как две задачи, выполняющиеся параллельно, одна отслеживает 5-минутный интервал, который записывает в Cassandra, а другая выполняет всеобработка, о которой я сказал, это сделать.
Это похоже на то, что я делаю обработку потоковых данных, а затем я кэшировал выходные данные этой обработки в spark как временную таблицу, и эта кэшированная таблица снова используется где-то в sparkсценарий, но только через некоторое время я хочу сохранить в Кассандре.
Любая помощь приветствуется