Из того, что я обнаружил на самом деле SSTable, полученное путем крупного уплотнения, не разделено в Кассандре. Другие базы данных дерева LSM опираются в этом случае на нарушенную файловую систему, которая разбивает SSTable (или HFile, CellSotre в Hypertable) на несколько файлов (например, 64 МБ), но основное сжатие либо должно сжать весь этот файл в новый SSTable (думаю неэффективен).
В JIRA есть билеты для улучшения и перепроектирования уплотнения для Кассандры, как упоминалось:
https://issues.apache.org/jira/browse/CASSANDRA-1608
Вы также можете прочитать мой второй симиральный вопрос:
Сколько данных на узел в кластере Cassandra?