Каков наилучший способ экспортировать все мои данные из кластера Cassandra? - PullRequest
1 голос
/ 16 октября 2019

Я очень новичок в Кассандре, и любая помощь здесь будет оценена. У меня есть кластер из 6 узлов, который охватывает 2 центра обработки данных (по 3 узла в каждом кластере). Мой клиент решил, что он больше не хочет обновлять свою лицензию Cassandra с помощью Datastax и хочет, чтобы их данные экспортировались в формат, который в будущем можно будет легко импортировать в другую базу данных. Я думал об экспорте данных в виде файла CSV, но, поскольку данные распределяются между всеми узлами, я не уверен, каков наилучший способ экспорта всех данных.

Ответы [ 2 ]

1 голос
/ 16 октября 2019

Один вариант - вы должны быть в состоянии использовать команду CQL COPY - которая копирует данные в формат CSV. Хорошая особенность копирования заключается в том, что вы можете запустить его с одного узла (то есть это не инструмент уровня "узла"). Команда будет (один раз в cqlsh):

CQL> COPY. в '/ path / to / file'

Если имеется много данных или много таблиц, этот инструмент может не подойти. Но для небольшого числа таблиц, которые не имеют ОГРОМНЫХ счетчиков строк (<несколько миллионов), это работает хорошо. Надеюсь, это поможет. </p>

-Джим

0 голосов
/ 20 октября 2019

Вы можете использовать команду CQL COPY для экспорта данных из кластера Cassandra. Однако, это полезно для небольшого набора данных, если у вас большой размер данных, эта команда бесполезна, потому что она приведет к некоторой ошибке или проблеме тайм-аута. Кроме того, вы можете использовать sstabledump и экспортировать дату по узлам в формат JSON. Надеюсь, это будет полезно для вас.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...