Получить все документы индекса в файле Elasticsearch 1.7 - PullRequest
0 голосов
/ 07 января 2019

У меня есть индекс размером 25 ГБ вasticsearch версии 1.7, и я хочу обновить его до ES 5.5. Но поскольку документы имеют пустые имена полей (строки), которые поддерживаются в версии 1.7, но отсутствуют в версии 5.5, я хотел бы заменить все пустые строки значениями null.

Поскольку кто-то еще проиндексировал данные, я не знаю, смогу ли я найти источник, чтобы исправить это и снова проиндексировать данные. Но так как данные уже проиндексированы, есть ли способ получить все документы индекса в файле .json, который можно использовать для исправления ошибок и повторного индексирования?

Например - получить все документы в bulk.json и затем снова проиндексировать их с помощью обычного запроса post в версии ES 5.5.

Я попробовал несколько способов, а также изучил этот , но не нашел ничего, что могло бы хранить все документы объемом 25 ГБ в одном bulk.json

Дайте мне знать, если есть другие способы решить эту проблему.

1 Ответ

0 голосов
/ 07 января 2019

Используйте ElasticDump, это будет прямо

npm install elasticdump

Тогда

elasticdump \
    --input=http://production.es.com:9200/my_index \
    --output=/data/my_index_data.json \
    --type=data
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...