У меня есть кольцо с 24 узлами в 2 центрах обработки данных.Каждый узел использует Apache Cassandra 2.2.10, и все в целом работают нормально.
Но я вижу ОГРОМНОЕ несоответствие между использованием дискового пространства и загрузкой, как сообщает nodetool.
На одном из узловЯ вижу:
=$ nodetool info | grep Load
Load : 1.99 TB
пока каталог данных только:
=$ sudo du -sh /var/lib/cassandra/data/
331G /var/lib/cassandra/data/
Там есть несколько снимков, но, насколько я понимаю, они могут увеличить использование данных на диске,но не должен увеличивать нагрузку.Что было бы целесообразно, если бы при загрузке показывалось бы 100, а на диске было бы 300. Но для меня - загрузка в 6 раз превышает фактическое использование дискового пространства.
Я не использую сжатие диска и даже проверяю размеры файловкак сообщает ls - я получаю ~ 330G на диске.
Что мне не хватает?Почему нагрузка такая высокая?