Я подумываю использовать Debezium и Cassandra в своем проекте. У нас будет несколько, когда мы настроим кластер Active / Active Cassandra с - Активный / Активный 2 или 3 D C (стратегия NetworkTopology) - Фактор репликации 2
У меня есть одно беспокойство по поводу пропускной способности и объема данных . Согласно официальному документу Debezium, процесс Debezium будет читать журнал фиксации Cassandra каждого отдельного узла. Это означает, что одно событие вставки или изменения вызовет несколько событий, в этой настройке количество событий будет 4 или 6. Я понимаю, что это хорошее решение для высокой доступности, но в нашем случае это слишком много.
Можно ли уменьшить объемы данных с Debezium до Kafka?
- Возможность остановить публикацию событий в определенных c D C или в процессе?
- Возможность прекратить использование журнала фиксации в определенных c Регион?
https://debezium.io/