какая часть люценовой оценки рассчитывается во время поиска - PullRequest
0 голосов
/ 21 июня 2011
  1. Я пытаюсь понять, какую оценку выполняет lucene во время поиска? Я вижу, что Lucene TermVector содержит кучу статистических данных. Когда я ищу термин, как рассчитывается оценка во время запроса?

  2. Используется ли TermVector и его статистика при поиске? если да как?

1 Ответ

1 голос
/ 21 июня 2011

Класс Сходство отвечает за оценку документов.

A Сборщик перебирает документы. Он используется вместе с Scorer для назначения баллов и ранжирования документов по этим баллам. Экземпляр Scorer рассчитывает баллы при определенных условиях. Существует более десятка разных видов бомбардиров. Например, TermScorer вычисляет необработанный счет следующим образом:

getSimilarity().tf(f)*weightValue

Значение веса получено из запроса. Если нормализация включена во время индексации (чтобы оценки между запросами были более или менее сопоставимы), нормализация применяется после этого. Коэффициенты нормализации предварительно вычисляются и кэшируются.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...