«Полученные байты» для оператора Flink относятся к входящим данным, а «отправленные байты» относятся к исходящим данным. Другими словами, вы получаете это задом наперед: байты, полученные источниками данных, - это байты, полученные из HDFS, а байты, отправленные из приемника, - это байты, записанные в файл TXT.
Однако, как объяснено в этом ответе , Flink не предоставляет статистику полученных байтов для источников или байтов, отправленных для приемников, поэтому эти цифры равны нулю. Кстати, есть планы по улучшению этого в будущем выпуске.
Что касается перекрывающихся параллельных вычислений в конвейере потока данных - ну, да, это важная особенность конструкции Flink, которая может поддерживать непрерывные потоковые потоки данных. При выполнении пакетной рабочей нагрузки это необязательно, но не повредит.