Кассандра: Как смоделировать данные, чтобы можно было рассчитать процентное изменение временных диапазонов? - PullRequest
0 голосов
/ 23 июня 2018

У меня очень большое количество данных, которые я планирую хранить на Кассандре. Я новичок в Кассандре и пытаюсь найти модель данных, которая будет работать для меня.

Мои данные представляют собой различные параметры для товаров, собранных за нерегулярные промежутки времени:

commodity_id | timestamp    | param1 | param2 
c1           | '2018-01-01' | 5      | 15
c1           | '2018-01-03' | 7      | 15
c1           | '2018-01-08' | 8      | 10
c2           | '2018-01-01' | 100    | 13
c2           | '2018-01-02' | 140    | 13
c2           | '2018-01-05' | 130    | 13
c2           | '2018-01-06' | 150    | 13

Мне нужно запросить базу данных и получить идентификаторы товаров по «процентному изменению» в параметрах.

Ex. Найти все товары, чье param2 увеличилось более чем на 50% в период между «2018-01-02» и «2018-01-06»

1 Ответ

0 голосов
/ 24 июня 2018
CREATE TABLE "commodity" (
    commodity_id text,
    timestamp date,
    param1 int,
    param2 int,
    PRIMARY KEY (commodity_id, timestamp)
)

Вы должны быть в порядке с этой таблицей.Для товарного раздела можно ожидать ввода daysPerYear, который достаточно мал, поэтому вам не нужны искусственные ключи.Даже если у вас есть большое количество товаров, у вас не будет исчерпания разделов, так как разделитель murmur3 фактически имеет диапазон от -2 ^ 63 до + 2 ^ 63-1.Это 18 446 744 073 709 551 616 возможных значений.

Я бы взял данные из Кассандры и вычислил значения на уровне приложения.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...