Вы не можете использовать тест для создания модели TF-IDF, потому что вы не можете предполагать что-либо о наборе тестов.
Тем не менее, вам все еще нужен способ представления слов в тест установлен как числа. Вот почему вы должны тренироваться на наборе поездов (vectorizer.fit_transform(train_corpus)
), но только преобразовывать (без обучения) тестовый набор (vectorizer.transform(test_corpus)
).