Cloudera в HDP SOLR (версия 5.5.2) Миграция данных |Не удалось обновить индексы solr после восстановления в облаке solr - PullRequest
0 голосов
/ 03 июня 2018

Версия SOLR - 5.5.2

Требование моего проекта - перенести облачные индексы solr из кластера cloudera в кластер HDP.

  • Данные огромны (1 миллиард проиндексированных записей на производстве), поэтому реиндексация невозможна.

Мы пытались использовать API восстановления и резервного копирования solr, но данныене видно на облаке.Проверьте, не пропустили ли мы какой-либо шаг снизу ==>

1) Разрешенный снимок (кластер Cloudera):
sudo -u hdfs hadoop dfsadmin -allowSnapshot / user / solr /CollectionName

2) Созданный снимок :
sudo -u hdfs hadoop dfs -createSnapshot / user / solr / CollectionName /

3) Создана коллекция solrв кластере HDP : с тем же именем, тем же количеством осколков и реплик.

4) Использовал «distcp» для передачи снимка :
sudo -u solr hadoop distcp hdfs: // NameNodeCDH-IP: 8020 / user / solr / CDHCollectionName / .snapshot / s20180601-131020.000 hdfs: // NameNodeHDP-IP: 8020 / user / solr

5) Восстановление снимка на уровне коллекции:
sudo -u solr hadoop fs -cp /user/solr/s20180601-131020.000/* / user / solr / HDPCollectionName / Восстановленный снимок из / user / solr в каталог коллекции для каждого сегмента и реплики.

OUTCOME : каталог HDFS восстановлен, но данные не видны в интерфейсе SOLR.Показано 0 записей.Проверенный каталог HDFS с использованием-
sudo hadoop fs -du -s -h / user / solr / HDPCollectionName /

HDP SOLR Размер каталога данных -

СОЛНЕЧНЫЙ ОБЛАК ДАННЫХ - НОЛЬ 0

...