Мы используем Solr 1.4 для получения результатов для пользовательских запросов. Результаты извлекаются из индекса, содержащего около 500 тыс. Документов. Индекс постоянно обновляется новыми документами, а срок действия старых документов истекает.
Страницы результатов представляют собой списки документов, отсортированные по релевантности (баллам), автоматически рассчитываемые по solr в зависимости от запроса пользователя. Каждый документ относится к одной категории (например, проектирование, финансы, администрация, математика и т. Д.), А идентификатор категории хранится и индексируется Solr.
Мы хотим добиться того, чтобы документы сортировались по релевантности, а также каким-то образом взвешивались так, чтобы хотя бы на первой странице результатов (10, 20 или 50) содержались документы из максимально возможного количества категорий и несколько документов одной категории являются последовательными.
Мы много искали, но не смогли придумать ни одного возможного сценария.
Большое спасибо заранее за любые идеи.
GK