Запрос для TF-IDF - PullRequest
       9

Запрос для TF-IDF

0 голосов
/ 09 октября 2019

Итак, я читаю эту статью для реализации TF-IDF https://towardsdatascience.com/tfidf-for-piece-of-text-in-python-43feccaa74f8.

После обработки текста и вычисления TF, IDF и TF-IDF я получу словарь, что-то вроде {'TFIDF_score': 0.0368605, 'doc_id': 1, 'key:' 'if'}за каждое слово в моем тексте.

Мой вопрос: каков наилучший способ реализовать и вычислить запрос для этого? Допустим, мой запрос 'two'. Его TFIDF_score равно 0.9987384. Должен ли я создать вектор для моего запроса, вычислить норму и рассчитать скалярное произведение на основе моего запроса и моего doc_id (dot_prod(query, doc_id))?

Спасибо за помощь. Я оценил это

...