Распределенный Solr: разное количество результатов каждый раз - PullRequest
1 голос
/ 03 декабря 2011

Я использую фасетный поиск в SolrCloud, чтобы получить статистику по моему корпусу. Запрос выглядит примерно так:

http://master -node: 8983 / Solr / выберите д = field1: value1 & DISTRIB = верно и фаска = истина & facet.field = field1 & facet.limit = 50000 & строк = 0 & FQ = field2: значение2

Однако в производстве с большим количеством документов, распределяемых между ~ 5 машинами, главный узел каждый раз возвращает различное количество результатов. (Каждый ведомый сам по себе возвращает правильное значение).

Я ожидал, что это связано с небольшим тайм-аутом для шардов, поэтому я добавил следующие параметры в обработчик поисковых запросов в solr/conf/solrconfig.xml:

<int name="shard-socket-timeout">10000</int>
<int name="shard-connection-timeout">10000</int>

но это не помогло.

Мне не хватает какой-то конфигурации или это просто ошибка ? Если это ошибка, как я могу ее преодолеть (кроме отслеживания вручную каждого раба)?

...