У меня есть неограниченный источник данных (поток Kafka) в качестве входных данных для моей работы с лучом.
Характеристики c данных:
- Это группы элементов (размер группы составляет от 5 до 20 элементов).
- Ключ каждой группы является уникальным идентификатором и используется только для этой группы.
- Максимальная разница во времени между первым и последним элементами в группе составляет менее 2 секунд.
![enter image description here](https://i.stack.imgur.com/yusd3.png)
Я хочу выполнить следующее:
- Группирование их вместе по их ключу
- Обработка каждой группы по отдельности.
Я понял, что могу использовать функцию GroupByKey для этого.
![enter image description here](https://i.stack.imgur.com/M5KLO.png)
Но тогда, поскольку это неограниченный источник, мне нужно применить оконное управление, иначе GroupBy никогда не завершится. ![enter image description here](https://i.stack.imgur.com/pdKzv.png)
Мой вопрос: есть ли способ, позволяющий мне сгруппировать каждую клавишу в отдельном окне, и закрыть его через определенное время? Большое спасибо