Кассандра (DSE) - нужно предложение по использованию PER PARTITION LIMIT для огромных данных - PullRequest
0 голосов
/ 09 января 2020

У меня есть таблица с 4M разделов, и каждый раздел содержит 4 строки. Таким образом, итоговые данные в таблице будут иметь 16M строк (широкие столбцы). Поскольку наша таблица является базой данных временных рядов, нам нужна только последняя строка или версия ключа partition_key. Я могу достичь желаемых результатов с помощью запроса ниже. Однако это повлияет на нагрузку на кластеры и отнимает много времени. Хотелось бы узнать, есть ли у нас какой-либо другой лучший способ добиться этого или это единственный способ.

SELECT some_value FROM some_table PER PARTITION LIMIT 1;

1 Ответ

0 голосов
/ 10 января 2020

Использование PER PARTITION LIMIT не повлияет на производительность. Фактически, это эффективно для достижения того, что вам нужно от каждого раздела, так как будет возвращена только первая строка, и он не будет перебирать другие строки в разделе. Ура! * * 1002

...