Создание вектора tfidf запроса с помощью scikit learn - PullRequest
0 голосов
/ 02 декабря 2018

Я хочу создать матрицу терминальных документов с векторизацией tfidf, что довольно просто с scikit learns tfidfVectrizer.У меня был вопрос: как я могу использовать совокупность слов для создания значений tfidf, но использовать значения idf документов, используемых в матрице терминов документов, для векторизации запроса, который может или не может уже появиться в исходных обработанных документах?Значения tf тривиальны, но значения idf можно получить только из уже обработанных документов.

...