Оценка результатов Solr по релевантности И категории - PullRequest
0 голосов
/ 13 декабря 2011

Мы используем Solr 1.4 для получения результатов для пользовательских запросов. Результаты извлекаются из индекса, содержащего около 500 тыс. Документов. Индекс постоянно обновляется новыми документами, а срок действия старых документов истекает.

Страницы результатов представляют собой списки документов, отсортированные по релевантности (баллам), автоматически рассчитываемые по solr в зависимости от запроса пользователя. Каждый документ относится к одной категории (например, проектирование, финансы, администрация, математика и т. Д.), А идентификатор категории хранится и индексируется Solr.

Мы хотим добиться того, чтобы документы сортировались по релевантности, а также каким-то образом взвешивались так, чтобы хотя бы на первой странице результатов (10, 20 или 50) содержались документы из максимально возможного количества категорий и несколько документов одной категории являются последовательными.

Мы много искали, но не смогли придумать ни одного возможного сценария.

Большое спасибо заранее за любые идеи. GK

1 Ответ

1 голос
/ 13 декабря 2011

Насколько мне известно, это не возможно в Solr. Я имею в виду, что если поисковый термин гораздо более применим к инженерным предметам, чем что-либо еще, вам необходимо искусственно повысить другие категории по-разному в зависимости от результата поиска.

Вы можете сделать что-то подобное в последней версии, используя сворачивание поля . То есть вы получите только X результатов из категории, а затем ссылку на ' показать больше как '.

Кроме того, вы можете выполнить несколько поисков, по одному для каждой категории, и «смешать их» самостоятельно.

...