Это очень сильно зависит от вашего сценария использования (например, какую бизнес-логику делают потребители, как они развертываются: автономные приложения, кластеры и т. Д.). Ваш вопрос больше касается архитектуры. Оба решения являются жизнеспособными, особенности в вашем конкретном случае использования.
Если вы семантически разбиваете свою бизнес-логику на другой поток, я бы предложил перейти ко второму варианту.
Что касается объема данных, имейте в виду, что большинство потребителей Kafka должны воспользоваться механизмом противодавления, чтобы они могли обрабатывать, сколько они потребляют.