Я храню исторические данные временных рядов на Кассандре.
cassandra@cqlsh>CREATE TABLE data."InstrumentTimeSeries" (
key blob,
column1 bigint,
value blob,
PRIMARY KEY (key, column1)
) WITH COMPACT STORAGE
AND bloom_filter_fp_chance = 0.01
AND comment = ''
AND dclocal_read_repair_chance = 0.0
AND default_time_to_live = 0
AND gc_grace_seconds = 864000
AND max_index_interval = 2048
AND memtable_flush_period_in_ms = 0
AND min_index_interval = 128
AND read_repair_chance = 0.0
AND speculative_retry = '99.0PERCENTILE'
AND caching = {
'keys' : 'ALL',
'rows_per_partition' : 'NONE'
}
AND compression = {
'sstable_compression' : ''
}
AND compaction = {
'class' : 'SizeTieredCompactionStrategy'
};
В столбце «значение» я сохраняю весь JSON после сериализации этого.
Теперь я хочу получить записи на основе некоторых ключей из json, хранящихся в столбце значений.
- Я могу создать дублирующуюся таблицу, добавив новые столбцы кластеризации как
согласно требованиям. или
- Я могу вспомнить вторичный ИНДЕКС
У меня более 20 миллионов записей в таблице.
Каков наилучший способ сделать это?