Значение нулей в матрице TF-IDF, суммированных по столбцам - PullRequest
0 голосов
/ 02 июля 2019

Я создал матрицу баллов TF-IDF для коллекции документов и предоставил словарь для них, используя scikit-learn's TFIDFVectorizer.Поскольку я хотел, чтобы самые важные слова были в корпусе, я суммировал значения по столбцам, то есть суммировал значения TF-IDF для каждого слова во всех документах.Что это значит, когда эта сумма равна 0 для определенных слов?Словарь получен только из документов, так что это не значит, что они не из документов или что-то в этом роде.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...