Каждые 15 минут мы получаем несколько миллионов записей. Как лучше всего объединить текущий набор записей с предыдущим набором записей для тех же идентификаторов в искровой структурированной потоковой передаче? Как повторно инициализировать предыдущее состояние после перезагрузки? Мы пробовали HBase сохранить предыдущее состояние, но это оказалось очень медленным. Если мы используем произвольные сеансы искры, как повторно инициализировать предыдущее состояние после перезапуска? Сейчас мы реализовали это в потоках Kafka. Но хочу знать, есть ли способ реализовать в искровой структурированной потоковой передаче.