Solr удаляет / оптимизирует влияние рейтинга рейтинга - PullRequest
2 голосов
/ 19 августа 2011

кто-нибудь знает, почему на рейтинг Solr влияет удаление (но не очистка) документов?

т.е.если я добавляю документ и ищу его, его оценка может быть 4.7, но затем, если я добавлю его заново (т. е. Solr удалит старый и добавит его снова ... с теми же значениями), тогда сделаю тот же запрос, и результат получит оценку4,5.Если я выполню оптимизацию индексов, то счет снова возвращается к 4.7.

Я считаю, что это связано с разницей между maxDoc и numDoc в Solr, когда документ был логически удален, но не удален из индекса.

Это ошибка?В моем случае это вызывает проблемы, поскольку порядок сортировки оказывается нестабильным, когда удаляется несвязанный документ (не в моем наборе результатов).

Это Solr 3.2.0

-Matt

1 Ответ

0 голосов
/ 19 августа 2011

Это на самом деле не ошибка, скорее, как Solr работает по умолчанию - поскольку вы предполагаете, что удаление документа фактически не удаляет его, пока вы не оптимизируете, таким образом, статистика все еще отражает удаленный документ до этого момента.Преимущество состоит в том, что это делает удаление быстрой операцией (оптимизация обычно выполняется как случайный процесс).Некоторые другие движки (например, Xapian) действительно полностью удаляют документы.

...