Основная проблема, с которой я столкнулся, - это ранжировать документы в соответствии с их релевантностью или какими-либо другими показателями.
Теперь я пришел к выводу, что документы, ранжированные по их содержанию (релевантности), дают лучшие результаты.
Я использую векторный подход для ранжирования документов на основе поисковых слов, указанных в запросе. Я не уверен, что это лучший подход, но он дает результаты со средней точностью