Kafka и Kafka Connect на самом деле не предназначены для «пакетной».То есть вы можете использовать его пакетно-управляемым способом, но концепция его интеграции в описанный вами последовательный рабочий процесс не является родной для него.
Интервал опроса соединителя JDBC таков, что вы можете периодически проверять наличие новых данных со скоростью, с которой вы получаете баланс между нагрузкой на исходную систему (из опроса) и задержкой полученных данных.
Почему бы не настроить соединитель на опрос каждые несколько минут (или несколько раз в час; что угодно), а затем, как только появятся новые данные, он их извлечет. Никаких новых данных, никаких новых записей.
В качестве альтернативы, вы можете использовать REST API Kafka Connect для программного запуска и остановки соединителя.Перед вашей нагрузкой, пауза разъема.После загрузки возобновите разъем.Если вы используете паузу / резюме, обратите внимание, что вы все равно захотите правильно установить интервал опроса.Вы также можете просто удалить и воссоздать его каждый раз.
Вы также можете рассмотреть подход CDC на основе журнала ( за и против ).