Стратегия сжатия временного окна - PullRequest
0 голосов
/ 26 июня 2018

Я читал документацию по этому вопросу и изо всех сил пытаюсь получить полное понимание этого.

В документации говорится: «Рекомендуется для временных рядов и рабочих нагрузок с истекающим сроком службы (TTL)». Я не уверен, что означает «рекомендуется для временных рядов». Означает ли это, что ключ раздела является типом данных времени / даты (например, отметка времени), означает ли это, что столбцы кластеризации также относятся к этому типу?

Возьмем, к примеру, приведенный ниже ключ раздела: insert_timestamp является столбцом кластеризации, но в формате BIGINT (но на самом деле это дата / время в формате эпох). Я не верю, что обновления происходят.

ПЕРВИЧНЫЙ КЛЮЧ ((sku, loc_id), insert_timestamp, supply_id)

TTL предоставляется во время вставок. Соответствует ли это хорошему кандидату для уплотнения по времени (потому что они хранят данные, скажем, за 1 месяц)? Когда они говорят «рекомендуется для временных рядов», что именно это означает?

Заранее спасибо.

-Джит

1 Ответ

0 голосов
/ 27 июня 2018

Да, это так. По сути, если у вас есть сценарий, где вы только вставляете и не обновляете данные. И тогда данные истекают через определенный промежуток времени.

Вы находитесь в сценарии только с добавлением, который соответствует требованиям TWCS.

Это выступление разработчика, создавшего TWCS. Проверьте это, чтобы понять внутренности TWCS. https://www.youtube.com/watch?v=PWtekUWCIaw

...