повышение термина в запросе Lucene - PullRequest
0 голосов
/ 04 июля 2011

Я хочу знать, когда термин повышается в запросе lucene, как меняются оценки? Я имею в виду, каков алгоритм подсчета в lucene для подсчета документов, когда запрос имеет один или несколько терминов, которые повысили?

1 Ответ

3 голосов
/ 04 июля 2011

Вы найдете полный ответ здесь:

http://lucene.apache.org/java/2_4_0/api/org/apache/lucene/search/Similarity.html

∑   ( tf(t in d)  ·  idf(t)^2  ·  t.getBoost() ·  norm(t,d) )

Каждый термин в запросе суммируется с

  • Периодичность использования одного термина запроса в документе
  • Частота обратного документа до степени 2 (если это применимо, тип поля и его атрибуты здесь важны)
  • Повышение это то, что вы спрашиваете
  • И норма для термина t в d (если применимо, может быть отключена в схеме)

Простой ответ - умножить его на весовой коэффициент.

...