Я создал матрицу баллов TF-IDF для коллекции документов и предоставил словарь для них, используя scikit-learn's TFIDFVectorizer.Поскольку я хотел, чтобы самые важные слова были в корпусе, я суммировал значения по столбцам, то есть суммировал значения TF-IDF для каждого слова во всех документах.Что это значит, когда эта сумма равна 0 для определенных слов?Словарь получен только из документов, так что это не значит, что они не из документов или что-то в этом роде.