В каком векторном пространстве вычисляется алгоритм Роккио? - PullRequest
0 голосов
/ 17 марта 2020

Я пытался реализовать алгоритм Роккио, и я понимаю основную идею, лежащую в основе алгоритма, но я изо всех сил пытаюсь сформулировать ее в конкретных терминах. Я вычислял tf_idf раньше, и это вектор длины количества условий запроса, которые мы ищем для каждого документа, который содержит хотя бы один из условий запроса. Но сейчас я чувствую, что не могу представить документ как вектор в пространстве, образованном только терминами запроса, потому что это не позволит мне «обнаружить» другие термины, которые имеют соответствующие документы. Должен ли я затем представить вектор запроса и векторы документов в векторном пространстве всех токенов, найденных в текущем возвращенном наборе документов?

1 Ответ

0 голосов
/ 18 марта 2020

Цитата да размерность векторов (как документов, так и запросов) - это размер словарного запаса коллекции ... поэтому эти векторы чрезвычайно редки (большинство записей являются нулями) ...

Да, как сказал @Debasis, это был правильный ответ.

...