Может ли pyspark структурированная потоковая передача привести к затовариванию задачи? - PullRequest
0 голосов
/ 17 апреля 2020

У меня есть структурированная потоковая передача pyspark, которая считывает данные из kafka, и я использую оконную функцию для агрегирования данных, но обработка агрегации может занять много времени, так как она не будет полностью обработана, пока идет следующее окно, будет ли оно привести к затовариванию задачи?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...