SSTables или Hfiles объединены выше 1 ТБ? - PullRequest
1 голос
/ 23 января 2011

При значительном уплотнении объедините все sstables из регионального сервера (Hbase) и все SSTables из планшетного сервера (Cassandra) в один большой.

Если наступает период, объединяются ли мои SSTables (общий объем свыше 1 ТБ) в один?Мэйби, есть некоторые границы диапазона для SSTable или HFile, которые разбивают его на несколько частей - чтобы убедиться, что операции слияния не «перезаписывают весь сервер»?

Мой вопрос связан с разделом «Сжатие» этой ссылки http://wiki.apache.org/cassandra/MemtableSSTable

1 Ответ

1 голос
/ 30 января 2011

Из того, что я обнаружил на самом деле SSTable, полученное путем крупного уплотнения, не разделено в Кассандре. Другие базы данных дерева LSM опираются в этом случае на нарушенную файловую систему, которая разбивает SSTable (или HFile, CellSotre в Hypertable) на несколько файлов (например, 64 МБ), но основное сжатие либо должно сжать весь этот файл в новый SSTable (думаю неэффективен).

В JIRA есть билеты для улучшения и перепроектирования уплотнения для Кассандры, как упоминалось:

https://issues.apache.org/jira/browse/CASSANDRA-1608

Вы также можете прочитать мой второй симиральный вопрос:

Сколько данных на узел в кластере Cassandra?

...