Я столкнулся с проблемой структурированной потоковой передачи с помощью Spark.
Текущая настройка: у меня есть поток данных, исходящий от kafka. У каждого сообщения есть время события. Я использую это время событий, чтобы создать агрегаты окон и правило водяного знака для удаления состояния. Режим вывода - это режим добавления.
Цель: мне нужно упорядочить агрегаты окон по мере их истечения, чтобы я мог обрабатывать эти события в порядке четности windows. Я ожидаю, что состояние windows истечет последовательно из-за моего скользящего окна.
Проблема: Иногда порядок печати сообщений не является последовательным на основе windows. Например,
| [2020-06-11 08:02:00, 2020-06-11 08:03:00] |
| [2020-06-11 08:01: 00, 2020-06-11 08:02:00] |
Почему windows сбрасываются не по порядку? Я хотел, чтобы это заказали. Пожалуйста, помогите