В настоящее время у меня есть скрипт, который вызывает bin/sstable2json
для всех файлов шаблона /var/lib/cassandra/data/fake-keyspace/*-Data.db
и сохраняет выходные данные из std out на диск. Однако экспортированные файлы начинают занимать 10-кратное пространство всех файлов в /var/lib/cassandra
Я выбрал этот подход после прочтения следующего раздела http://wiki.apache.org/cassandra/Operations#Import_.2BAC8_export
Каковы некоторые из лучших практик для передачи данных из одного кластера в другой? Просто чтобы прояснить, я не пытаюсь добавлять дополнительные узлы в кольцо, а скорее перемещаю данные из одного кольца в другое в процессе, который повторяется.
Любая помощь или толчок в правильном направлении будет принята с благодарностью.