С учетом следующего прогнозируемого ранжированного списка документов:
query1_predicted = [1381, 1637, 646, 1623, 774, 1764, 92, 12, 642, 463, 613, ...]
и это лучший выбор, помеченный вручную:
query1_manual = 646
Есть ли какая-либо подходящая метрика из поиска информации, уже реализованная в pythonчтобы оценить этот результат?
Я не думаю, что NDCG работает для меня, потому что мне не хватает истинного и полностью ранжированного списка документов.Я полагаю, что вспомнить, точность, F-оценка и MAP также не будут работать, пока у меня нет полного списка ранжированных вручную результатов на запрос, указывающих на актуальность документа.
Кстати:Длина прогнозируемого списка равна общему количеству документов в моей коллекции:
len(query1_predicted) = len(documents)
Спасибо за помощь заранее!