Я пытался реализовать алгоритм Роккио, и я понимаю основную идею, лежащую в основе алгоритма, но я изо всех сил пытаюсь сформулировать ее в конкретных терминах. Я вычислял tf_idf раньше, и это вектор длины количества условий запроса, которые мы ищем для каждого документа, который содержит хотя бы один из условий запроса. Но сейчас я чувствую, что не могу представить документ как вектор в пространстве, образованном только терминами запроса, потому что это не позволит мне «обнаружить» другие термины, которые имеют соответствующие документы. Должен ли я затем представить вектор запроса и векторы документов в векторном пространстве всех токенов, найденных в текущем возвращенном наборе документов?