Работа с различными баллами из реплик Solr - PullRequest
0 голосов
/ 05 июля 2018

В реализации скоринга Solr по умолчанию удаленные документы по-прежнему учитываются при подсчете очков. Число удаленных документов на репликах сегмента не обязательно будет одинаковым, и, следовательно, разные реплики могут давать несколько разные оценки.

В настоящее время мы используем установку с 8 осколками, каждый из которых имеет 2 реплики. Для результатов поиска по страницам крайне важно, чтобы порядок сортировки был детерминированным, чтобы избежать пропуска документов / пропуска документов при поиске.

Возможные способы решения этой проблемы, которые приходят на ум, - это использовать другой алгоритм оценки или пытаться потребовать, чтобы система, использующая систему, отправляла запросы в те же реплики, которые обслуживали их первый запрос (это, очевидно, могло бы пойти не так, если бы копия была позже вниз!). Поскольку проблема заключается в разном наборе очков между репликами, а не разнице между шардами, я не думаю, что распределенные настройки Solr IDF помогают.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...