Что касается таблиц, содержащих неизменяемые данные временных рядов, я понимаю, что было бы желательно использовать TimeWindowCompactionStrategy
.
Строки сгруппированы по полю "time_stamp
", и запросы на чтение клиентом ограничены1000 новых (или около того) строк на первичный ключ (клиенты всегда хотят самые последние строки).Я настроил поле time_stamp
для cluster ordered by time_stamp desc
для этой цели
Например, запрос может выглядеть следующим образом:
"SELECT activity_type, activity_data from latest_user_activities where user_id = some_condition limit 1000;"
Мои строки вставляются с TTL
из 90дней или 365 дней в зависимости от значения поля activity_type
, в то время как activity_data
содержит метаданные, относящиеся к выполненному действию.
В общем, я не уверен в том, как "compaction_size
"должен быть настроен.
, если «окно уплотнения» будет выровнено по TTL вставленных строк, или, возможно, сколько строк должно содержаться в данном временном окне