У меня есть модель Apache Beam для обработки нескольких временных рядов в реальном времени. Развернутый на GCP DataFlow, он объединяет несколько временных рядов в окна, вычисляет совокупность и т. Д.
Теперь мне нужно выполнить одни и те же операции над историческими данными (одними и теми же (множественными) данными временных рядов) вплоть до 2017 года. Как я могу добиться этого, используя луч Apache?
Я понимаю, что мне нужно использовать свойство окон Apache Beam для расчета агрегатов и т. Д., Но он должен принимать данные от 2 лет назад
По сути, мне нужны данные, которые были бы доступны, если бы я развернул тот же конвейер 2 года. Это необходимо для тестирования / обучения модели