Влияет ли наличие уникального и большого количества небольших разделов в таблице на производительность или создает дополнительную нагрузку в cassandra - PullRequest
0 голосов
/ 02 октября 2019

У меня есть таблица с 4 миллионами уникальных ключей разделов. Выберите количество (*) из таблицы "KS" .table;

count

4355748 (1 строка)

Iпрочитал, что мощность ключа раздела не должна быть слишком высокой, а также не слишком низкой, что означает, что ключ раздела не должен быть слишком уникальным. Это правильно? В таблице нет ключа кластеризации. Поможет ли изменение разбиения данных с нагрузкой?

Ответы [ 2 ]

0 голосов
/ 11 октября 2019

Насколько я знаю, Cassandra использует согласованное хеширование для сопоставления ключа раздела с физическим разделом, поэтому количество элементов не должно иметь значения.

0 голосов
/ 02 октября 2019

Это действительно зависит от варианта использования ... Если у вас нет естественной кластеризации по разделам, то, возможно, не имеет смысла вводить ее. Кроме того, каковы образцы чтения? Вам нужно читать несколько строк за один раз или нет?

Количество разделов влияет на размер фильтра Блума, кеша ключей и т. Д., Так как вы увеличиваете количество секций, Блумфильтр увеличен, и кэш ключей имеет меньше попаданий (пока вы не увеличите его размер).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...