Сериализация и десериализация хэш-карты стоит дорого. Если бы вы могли заставить эту работу, например, кортежи или строки, это было бы лучше. Или вы можете рассмотреть возможность реализации настраиваемого источника таблиц, а затем воспользоваться преимуществами API Table / SQL и его оптимизаций.
В блоге Apache Flink есть недавняя статья с подробной информацией о сериализации, включая раздел о производительности. Я рекомендую всю статью, но для оценки производительности см. https://flink.apache.org/news/2020/04/15/flink-serialization-tuning-vol-1.html#performance -сравнение . Ваши результаты, безусловно, будут отличаться от тех, что показаны в этой статье - производительность сериализации сильно различается в зависимости от деталей того, что вы делаете, - но общие шаблоны, показанные там, заслуживают внимания.
Именно Трудно сказать, сколько вы получите от беспокойства обо всем этом. Чтобы знать наверняка, вам нужно будет провести собственный сравнительный анализ. Что касается вашего вопроса о типе stati c - я не уверен, но предполагаю, что с Kryo это не будет иметь большого значения.