Использование Solr в качестве источника данных для Solr с DIH - PullRequest
0 голосов
/ 26 февраля 2020

В настоящее время наша индексация Solr очень медленная с использованием данных захвата DIH из MySQL. Он использует дочерние объекты, и огромное количество запросов приводит к постоянному старению данных в Solr.

Я думал о том, чтобы разбить эти 3 запроса на их собственные ядра, а затем использовать «более плоские» ядра с DIH для Выпуск запросов Solr через http API для создания агрегированного ядра.

Кто-нибудь знает, возможно ли это или возможно?

Мы используем Solr 6.6.6

1 Ответ

0 голосов
/ 26 февраля 2020

Если вы решили разбить их на 3 запроса и если вы можете запускать их параллельно без проблем, вы также можете иметь 3 файла импорта данных и запускать их параллельно с одной и той же коллекцией Solr.

Вам действительно не нужно иметь 3 коллекции, а затем объединенную коллекцию. Вы можете сэкономить много времени и материалов.

  <requestHandler name="/dataimport" class="solr.DataImportHandler">
    <lst name="defaults">
      <str name="config">db-data-config-part1.xml</str>
    </lst>
    <lst name="defaults">
      <str name="config">db-data-config-part2.xml</str>
    </lst>
    <lst name="defaults">
      <str name="config">db-data-config-part3.xml</str>
    </lst>
  </requestHandler>
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...