Последствия неизменности SSTable в Cassandra для использования диска - PullRequest
2 голосов
/ 01 марта 2012

Согласно:

http://www.datastax.com/docs/1.0/ddl/column_family#about-column-family-compression

Причина, по которой СУБД видит производительность деградация в результате сжатия, заключается в том, что необходимо перезаписать данныена диске, распаковывается, перезаписывается, а затем повторно сжимается.С другой стороны, Кассандра может видеть производительность увеличение для операций чтения и записи, потому что SSTable является неизменным, поэтому никакие записи никогда не перезаписываются, и поэтому издержки намного меньше, чемСжатые СУБД.

Мне интересно, каковы последствия этого в долгосрочной перспективе, поскольку хранилище данных Cassandra продолжает расти?Кажется, единственное последствие - постоянно растущая потребность в большем дисковом пространстве, это правильно?

1 Ответ

4 голосов
/ 02 марта 2012

Периодически Cassandra будет запускать процесс уплотнения ваших существующих SSTables.Сжатие объединяет несколько SSTable в один новый большой SSTable, отбрасывая устаревшие данные.После того, как произошло сжатие, Кассандра (в конце концов) удалит старые SSTables.

Таким образом, если размер вашего набора данных стабилен, ваш размер SSTable не будет бесконечно расти. Вики Cassandra содержит больше информации о уплотнении .

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...