Недавно я столкнулся с одной проблемой при загрузке данных в новые кластеры. По сути, я запускаю несколько sstableloader на каждом моем исходном узле кассандры, чтобы передавать данные в совершенно новый кластер кассандры с 3 узлами, исходный кластер также имеет 3 узла.
Сначала все работает довольно хорошо, но в конце концов я нашел вне нового кластера был OOD в середине. Объем данных в моем исходном кластере составляет около 15 ГБ на узел, а RF == 3, он занимал около 200 ГБ на моем новом кластере, и, кажется, этого недостаточно.
Мне было интересно, что Cassandra выполняла сжатие во время потоковой передачи данных в? Поскольку я проверил диск и обнаружил, что в одной из таблиц содержится более 4000+ файлов .db.