Если я правильно понимаю ваш вопрос, вы хотели бы прочитать CSV-файлы и суммировать некоторые поля. Это довольно простой запрос и не проблема для Flink.
В последней версии Flink (1.4.2) вы можете зарегистрировать CsvTableSource
в виде таблицы и выполнить запрос типа SELECT sum(a), sum(b) FROM yourTable
.
Обратите внимание, что файлы CSV должны храниться в файловой системе, доступной для всех компьютеров (распределенная файловая система, NFS, ...).