Оценка Lucene: TermQuery без TermVectors - PullRequest
1 голос
/ 05 января 2011

Приводит ли TermQuery: ExtractTerms к большему числу при включении termvectors / позиции / смещения? (при условии, что совпадение произошло более 1 раза). И наоборот, если информация о инвертированном файле отключена, всегда ли ExtractTerms возвращает 1 и только 1 член?

РЕДАКТИРОВАТЬ: Как и где включение терминов-векторов в схеме влияет на скоринг?

1 Ответ

1 голос
/ 05 января 2011

TermQuery.ExtractTerms извлекает термины из запроса , а не результат.Таким образом, поиск «foo: bar» всегда будет возвращать ровно один термин, независимо от того, что находится в индексе.

Мне кажется, что вы хотите знать о выделении , а не Query.ExtractTerms.

РЕДАКТИРОВАТЬ : Исходя из вашего комментария, звучит так, будто вы спрашиваете: "Как оценка зависит от векторов терминов?"Ответ на этот вопрос: совсем нет.Термин частота, норма и т. Д. Рассчитывается во время индексации, поэтому не имеет значения, что вы храните.

Основным исключением является PhraseQuery с уклоном, в котором используется термин позиции.Небольшое исключение состоит в том, что пользовательские классы скоринга могут использовать любые данные, которые они хотят, поэтому не только векторы терминов, но и полезные данные и т. Д. Потенциально могут повлиять на оценку.ваш магазин не должен иметь никакого эффекта.

...