Версия SOLR - 5.5.2
Требование моего проекта - перенести облачные индексы solr из кластера cloudera в кластер HDP.
- Данные огромны (1 миллиард проиндексированных записей на производстве), поэтому реиндексация невозможна.
Мы пытались использовать API восстановления и резервного копирования solr, но данныене видно на облаке.Проверьте, не пропустили ли мы какой-либо шаг снизу ==>
1) Разрешенный снимок (кластер Cloudera):
sudo -u hdfs hadoop dfsadmin -allowSnapshot / user / solr /CollectionName
2) Созданный снимок :
sudo -u hdfs hadoop dfs -createSnapshot / user / solr / CollectionName /
3) Создана коллекция solrв кластере HDP : с тем же именем, тем же количеством осколков и реплик.
4) Использовал «distcp» для передачи снимка :
sudo -u solr hadoop distcp hdfs: // NameNodeCDH-IP: 8020 / user / solr / CDHCollectionName / .snapshot / s20180601-131020.000 hdfs: // NameNodeHDP-IP: 8020 / user / solr
5) Восстановление снимка на уровне коллекции:
sudo -u solr hadoop fs -cp /user/solr/s20180601-131020.000/* / user / solr / HDPCollectionName / Восстановленный снимок из / user / solr в каталог коллекции для каждого сегмента и реплики.
OUTCOME : каталог HDFS восстановлен, но данные не видны в интерфейсе SOLR.Показано 0 записей.Проверенный каталог HDFS с использованием-
sudo hadoop fs -du -s -h / user / solr / HDPCollectionName /
HDP SOLR Размер каталога данных -
СОЛНЕЧНЫЙ ОБЛАК ДАННЫХ - НОЛЬ 0