Кассандра: Отличается ли SELECT COUNT (*) между версиями 2.x и 3.x? - PullRequest
0 голосов
/ 03 декабря 2018

Я перемещаю данные из кластера Cassandra в версии 2.2.4 в кластер 3.11.3, экспортируя таблицу в виде файла CSV и используя ее для создания новой таблицы в новом кластере.Я использую SELECT COUNT(*), чтобы проверить, что данные были скопированы правильно, но я вижу расхождение в количестве строк.Может ли это быть из-за разницы в версиях?Есть ли что-нибудь еще, что могло бы объяснить это?Спасибо!

Вот шаги, которые я выполняю:

SELECT COUNT(*) FROM table_cass2
count
-------
  7951
(1 rows)

COPY table_cass2 TO '/tmp/table.csv'

COPY table_cass3 FROM '/tmp/table.csv'
Using 15 child processes  
Starting copy of <table> with columns [..].   
Processed: 7951 rows; Rate:    3741 rows/s; Avg. rate:    6045 rows/s
7951 rows imported from 1 files in 1.315 seconds (0 skipped).

SELECT COUNT(*) FROM table_cass3`  
 count  
-------
  7919
(1 rows)

1 Ответ

0 голосов
/ 03 декабря 2018

Чтобы ответить на мой собственный вопрос, кто-то из моей команды подтвердил, что нормально иметь небольшую, но постоянную разницу в результатах для SELECT COUNT(*) запросов между различными экземплярами Cassandra.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...