Apache Flink использует модель отложенной обработки в стиле DAG, аналогичную Apache Spark (поправьте меня, если я ошибаюсь). При этом, если я использую следующий код
DataStream<Element> data = ...;
DataStream<Element> res = data.filter(...).keyBy(...).timeWindow(...).apply(...);
.keyBy()
преобразует DataStream
в KeyedStream
и распределяет его среди рабочих узлов Flink.
Мой вопрос в том, как будет мигать ручка filter
здесь? Будет ли фильтр применяться к входящему DataStream
перед разделением / распределением потока, и DataStream
будет создан только из Element
, которые соответствуют критериям фильтра?