Почему точное совпадение с Lucene составляет всего 0,4? - PullRequest
1 голос
/ 02 апреля 2009

У меня есть документ, который содержит заголовок и описание. В одном из описаний товара есть «Доставка бесплатно с Amazon Prime» среди других слов.

Я выполняю поиск в lucene для «Доставка бесплатна в Amazon Prime» в заголовках и описании полей, используя perl Lucene

my $analyzer = new Lucene::Analysis::SimpleAnalyzer();
my @fields = ('title', 'description');
my $parser = new Lucene::MultiFieldQueryParser(\@fields, $analyzer);

Я получаю только 0,4 балла. Я предполагаю, что я получаю 0 за заголовок (без совпадения) и 0,8 за описание (точное совпадение) в среднем за 0,4.

Как я могу сопоставить заголовок и / или описание, которое в этом случае принесло бы мне 0,8 балла или более?

1 Ответ

4 голосов
/ 02 апреля 2009

Во-первых, вам нужно взглянуть на некоторую Теорию подсчета Lucene . Далее объяснение () объясняет, как запрос получил свою оценку. Я полагаю, что Plucene тоже объяснил. В-третьих, почему оценка должна быть 0,8 или больше? Оценки Lucene являются относительными и действительны в контексте определенного запроса. Их основное назначение - заказывать хиты. Если вам не нужен счет для другой цели, и пока относительный порядок не изменится, я не буду заботиться об абсолютном балле.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...