У меня есть неограниченный источник данных (поток Kafka) в качестве входных данных для моей работы с лучом.
Характеристики c данных:
- Это группы элементов (размер группы составляет от 5 до 20 элементов).
- Ключ каждой группы является уникальным идентификатором и используется только для этой группы.
- Максимальная разница во времени между первым и последним элементами в группе составляет менее 2 секунд.
Я хочу выполнить следующее:
- Группирование их вместе по их ключу
- Обработка каждой группы по отдельности.
Я понял, что могу использовать функцию GroupByKey для этого.
Но тогда, поскольку это неограниченный источник, мне нужно применить оконное управление, иначе GroupBy никогда не завершится.
Мой вопрос: есть ли способ, позволяющий мне сгруппировать каждую клавишу в отдельном окне, и закрыть его через определенное время? Большое спасибо