Что я понимаю по вашему вопросу, так это то, что вы намереваетесь ранжировать документы на основе сходства с некоторыми другими документами, которые будут предоставлены пользователем в вашей поисковой системе.
Это может быть выгодно, если пользователь уже имеет справочный документ для предоставления вашему движку, например, какой-то исследователь ищет статьи, похожие на тот, который ему / ей сейчас интересен,или кто-то, кто интересуется чтением, хочет узнать о книгах, похожих на ту, которую он / она читает в настоящее время (например, рекомендации amazon, , но , которые похожи на покупателей, которые купили это-Item-Также-Купленный -...)
Что касается вопроса использования этого подхода или подхода, основанного на запросах, я не думаю, что большинство пользователей будет иметь какой-либо документ или цифровой ресурс дляпредоставить вход.Я бы реализовал поиск на основе запросов и имел бы возможность поиска Similar-document , чтобы его могли использовать те, кто в нем нуждается, например Google Scholar .
.