Краткая версия: если Cassandra настроена в соответствии с рекомендациями для commitlog на отдельном диске из каталогов данных, то очистка и сжатие должны иметь незначительное влияние.
Предостережения:
Обновления в основном связаны с процессором, а сжатие требует много ресурсов процессора. Если вы работаете на машинах или виртуальных машинах с менее чем 4 ядрами [не в вашей ситуации, а ради полноты], вы можете уменьшить значение compaction_throughput_mb_per_sec, чтобы уменьшить его.
Если у вас достаточно одновременной очистки всех CF (что может показаться так, когда вы обновляете 2/3 ваших CF с каждым запросом), Cassandra может временно блокировать запись, чтобы убедиться, что она не принимает записи быстрее чем он может очистить их (что в конечном итоге может привести к нехватке памяти и смерти). 4 ГБ - относительно небольшая куча для вставок большого объема во многих CF; Я бы предложил увеличить это значение до 8. Стоит также включить ведение журнала JVM GC, чтобы увидеть, насколько тяжело работает JVM - примеры настроек приведены в cassandra-env.sh.
Наконец, вы не упоминаете версию Cassandra, которую вы используете, но производительность надежно повышалась с каждым основным выпуском. Особенно, если вы используете что-то старше 0,8, я бы порекомендовал обновить.