Как подсчитать количество ключей строк для определенной семьи column_family в Кассандре (подробнее) - PullRequest
3 голосов
/ 22 ноября 2011

Я пытаюсь загрузить данные из SQL в No-SQL, т.е. Cassandra. но почему-то несколько строк не совпадают. Может кто-нибудь сказать мне, как посчитать количество ключей строк для определенной семьи column_family в Кассандре.

Я пробовал get_count и get_multicount, но эти методы требуют передачи ключей. В моем случае я не знаю ключей, Вместо этого мне нужно количество строк для row_keys. list column_family_name дает мне список, но ограничен только 100 строками. там в любом случае, Я могу отменить ограничение 100.

Ответы [ 2 ]

1 голос
/ 22 ноября 2011

Насколько я знаю, нет способа получить количество строк для семейства столбцов. Вместо этого вы должны выполнить запрос диапазона по всему семейству столбцов.

Если cf является вашим семейством столбцов, должно работать что-то вроде этого:

num_rows = len(list(cf.get_range()))

Однако документация для get_range указывает, что это может вызвать проблемы, если у вас слишком много строк. Возможно, вам придется делать это порциями, используя start и row_count.

0 голосов
/ 17 марта 2016

Вы можете считать строки Кассандры, не читая все строки.

См. реализацию в Spark для cassandraCount(), которая делает это довольно эффективно.

...