Я искал нормализацию оценки в течение нескольких дней (, теперь я знаю, что этого нельзя сделать ) в Lucene, используя список рассылки, вики, посты блога и т. Д. Я собираюсь раскрыть мою проблемупотому что я не уверен, что нормализация баллов - это то, что нужно нашему проекту.
Справочная информация : В нашем проекте мы используем Solr поверх Lucene с пользовательскими RequestHandlers и SearchComponents.Для данного запроса нам нужно определить, когда запрос получил плохие результаты для запуска различных действий.
Допущения : неизменный индекс (после индексации он не обновляется) и та же типология запроса (dismax qparser с тем же повышением поля, без функций повышения или запросов на повышение).
Проблема : Мы знаем, что нормализация оценки не осуществима.Но есть ли какой-нибудь способ определить (используя TF / IDF и допущения повышения поля), когда результаты поиска соответствуют низкому качеству результатов?
Пример: у нас есть индекс с научными работами и другой с информацией медцентра.Когда пользователь запрашивает первый индекс и получает плохие результаты (выводя его из оценки?), Мы хотим запросить второй индекс и объединить результаты, используя некоторый порог (порог оценки?)
Заранее спасибо