Kafka Streams избегает параллелизма по своему замыслу - если накопленное не должно быть отказоустойчивым, вы можете сделать это в памяти и удалить его с помощью пунктуации времени на настенных часах.
Если это необходимочтобы быть отказоустойчивым, вы можете использовать хранилище состояний и сканировать весь магазин в пунктуации, чтобы очистить его.
Это даст вам накопление на уровне задач.Не уверен, как аккумулятор Spark работает в деталях, но если он дает вам «глобальное» представление, я предполагаю, что ему нужны данные для передачи по сети, и только один экземпляр имеет доступ к данным (или, возможно, широковещательная рассылка, а неконечно, как последовательность будет гарантирована для случая трансляции).Аналогично, вы можете отправить данные в тему (с 1 разделом), чтобы собрать все данные глобально в одном месте.