Так что я нашел решение, я опубликую его на тот случай, если у кого-то еще возникнет тот же вопрос.
Когда я читаю моделирование данных , кажется, ответ. Что означает:
В Cassandra db у нас есть ключи разделения и ключи кластеризации . Cassandra имеет возможность обрабатывать несколько вставок одновременно. Это дает нам возможность вставлять данные в более чем одну таблицу одновременно, что в значительной степени означает, что мы можем создавать разные таблицы для одного и того же приложения сбора данных, которое будет использоваться таким же образом, как и материализованные представления (MySql).
Например, допустим, у нас есть схема журнала {sensor_id, region, value},
Первое, что приходит на ум, - это создать таблицу с именем sensor_per_row , например:
sensor_id | value | region | ts
-----------+-------+------------+---------------
Это очень эффективный способ хранения данных в течение длительного времени, но, учитывая функции Кассандры, не так просто визуализировать и извлекать из них аналитику.
Поэтому мы можем создавать разные таблицы с ttl (ttl обозначает время жизни), что просто означает, как долго будут храниться данные.
Например, если мы хотим получить ежедневные измерения нашего конкретного датчика, мы можем создать таблицу с day & sensor_id в качестве ключей разделения и меткой времени в качестве ключа кластеризации с порядком Desc.
Если мы добавим и ttl значение 12 * 60 * 60 * 60, которое обозначает день, мы можем хранить наши ежедневные данные.
Таким образом, при создании, скажем, таблица sensor_per_day с указанным выше форматом и ttl будет фактически давать ежедневные измерения. И в конце дня таблица будет сброшена с помощью новые измерения, пока данные сохраняются в таблице предварительного просмотра sensor_per_row
Я надеюсь, что дал вам идею.