Кассандра - это распределенная система, и нет места, где она будет собирать данные по таблицам.Вы можете получить некоторые оценки из system.size_estimates
, но в нем будет указано только количество разделений на диапазон и их размеры.
Для такой платформы, как вы просите, вам может потребоваться разработка собственного кода Spark (самый простой способ), который будет выполнять подсчет строк и другие проверки.Spark высоко оптимизирован для эффективного доступа к данным и может быть более предпочтительным, чем написание пользовательского кода.
Кроме того, во время миграции рассмотрите возможность использования уровня согласованности, превышающего ONE
, чтобы убедиться, что по крайней мере несколько узлов подтвердили записьданные.Хотя это зависит от количества требований к данным и срокам для ваших заданий по миграции.