если я использую KAFKA connect для импорта всех этих таблиц, как мои потребители узнают, когда все данные будут загружены?
Как говорят другие ответы, они не вышли бы из коробка.
Вам необходимо будет контролировать процесс импорта вручную (или программно) или определить начальные условия «полноты», или, по крайней мере, в которых вы уверены в том, что начинаете потребителя.
Оттуда я бы предложил либо установить CD C, либо сделать так, чтобы клиенты и заказы сервисов писали напрямую на темы Кафки. Если вы пишете напрямую в Kafka, вам необходимо учитывать идемпотентные события, такие как заказ новых учетных записей клиентов, редактирование и удаление. Затем, если клиенты будут удалены, сохраните ли вы все заказы, связанные с этим клиентом, например?
Как только оба источника данных будут в темах, вы можете присоединиться к заказам клиентов вместе с KStreams / K SQL
это не будет работать
Возможно, вы захотите уточнить, что это такое, но потребитель по крайней мере из одного топи c будет работать нормально. Упомянутое выше объединение в конечном итоге будет согласованным во время импорта данных, но это компромисс, который у вас есть, поскольку в асинхронной обработке не используется транзакционная семантика атоми c