Я использую Кассандру, чтобы сохранить слово и его частоту.
Схема таблицы будет выглядеть как
CREATE TABLE keywords_rate (
some_id int,
keyword Text,
frequency counter,
PRIMARY KEY (some_id, keyword)
);
Проблема в том, что у меня есть миллионы записей, и мне нужно получить 100 лучших ключевых слов для каждого some_id
но для этого мне нужно получить все ключевые слова для заданного some_id
и отсортировать их по бэкэнду (python), а затем получить первые 100 записей. для меня это очень дорогая операция.
Итак, мой вопрос: могу ли я отсортировать счетчик внутри Кассандры? и если нет, каков наилучший подход к этому сценарию?
Спасибо.