nodetool cfstats Максимальное количество байтов в компактном разделе - PullRequest
0 голосов
/ 24 ноября 2018

Меня беспокоит значение "Максимальное количество байтов в компактном разделе", так как оно кажется довольно высоким с 89 МБ.

Указывает ли это на неисправность модели или какую-либо другую проблему?Со стороны приложения проблем не наблюдается.

Данные, хранящиеся в таблице, упаковываются в еженедельные сегменты для каждого устройства с использованием week_first_day, device_id ключ раздела.

Модель данных для таблицы:

CREATE TABLE device_data (
week_first_day timestamp,
device_id uuid,
nano_since_epoch bigint,
sensor_id uuid,
source text,
unit text,
username text,
value double,
PRIMARY KEY ((week_first_day, device_id), nano_since_epoch, sensor_id)
)

nodetool cfstats

Table: device_data
            SSTable count: 5
            Space used (live): 447558297
            Space used (total): 447558297
            Space used by snapshots (total): 0
            Off heap memory used (total): 211264
            SSTable Compression Ratio: 0.2610509614736755
            Number of partitions (estimate): 939
            Memtable cell count: 458
            Memtable data size: 63785
            Memtable off heap memory used: 0
            Memtable switch count: 0
            Local read count: 0
            Local read latency: NaN ms
            Local write count: 458
            Local write latency: 0.058 ms
            Pending flushes: 0
            Percent repaired: 99.83
            Bloom filter false positives: 0
            Bloom filter false ratio: 0.00000
            Bloom filter space used: 2216
            Bloom filter off heap memory used: 2176
            Index summary off heap memory used: 672
            Compression metadata off heap memory used: 208416
            Compacted partition minimum bytes: 43
            Compacted partition maximum bytes: 89970660
            Compacted partition mean bytes: 1100241
            Average live cells per slice (last five minutes): NaN
            Maximum live cells per slice (last five minutes): 0
            Average tombstones per slice (last five minutes): NaN
            Maximum tombstones per slice (last five minutes): 0
            Dropped Mutations: 0

1 Ответ

0 голосов
/ 24 ноября 2018

Это действительно зависит от шаблонов доступа к данным в этих разделах - если вы часто читаете весь раздел, то это может вызвать проблему, но если вы читаете только ее части, то это не должно бытьпроблема.Вы можете разбить разделы, используя, например, день в качестве корзины.

Посмотрите на доклад Мифы о больших разделах от Cassandra Summit 2 года назад - в нем есть более подробная информация о том, как это происходитобрабатывается в Кассандре 3.x.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...