Я хотел бы понять, как окно влияет на производительность в задании Flink. Я выполняю задание flink, состоящее из оператора, как показано ниже:
Параллелизм задания (4,8,16): [источник автоматического создания]-> [Map1] -> [Tumbling Window (10s)] -> [Map2] -> [Sink]
Мгновенное оконное исполнение eps 4p, 8p, 16p
Задание, превышающее производительность, ограничено примерно 50k + - в секунду, независимо от того, как я масштабирую кластер с параллелизмом 4-16.
Когда окно задания было удалено, задание может достигать 200k в секунду.
Параллелизм заданий (4-8): [источник автоматического создания] -> [Map1] -> [Map2] -> [Sink]
Производительность Flink noокно 4p, 8p
Я удалил логику окна, чтобы исключить логику приложения, которая ограничивает производительность, но кажется, что окно все-таки приводило к снижению производительности всего моего потока, даже если это окно просто проходное.function.
Этот снимок экрана показывает, что производительность для задания без окна и задания с включенным пустым окном.
Пустое окно показывает всплеск, но оператор замедлен
Поток был ограничен и больше не мог масштабироваться.В любом случае, чтобы повысить производительность для такого сценария?
Примечание. Задание не имеет зависимостей от внешних служб и контрольная точка отключена.