У меня есть текстовые данные, которые я сначала конвертирую в матрицу TFIDF, а затем обучаю их.Я использую библиотеку Scikit для преобразования текстовых данных в матрицу TF-IDF.Я не сохраняю модель и не тренирую ее каждый раз, когда необходимо классифицировать невидимые данные.Мне нужны предложения для создания матрицы TF-IDF из невидимых данных.Один из подходов, о котором я думаю, - это создание матрицы TF-IDF вместе с невидимыми данными, а затем создание модели с использованием обучающих данных и прохождение матрицы TFIDF невидимых данных, которые должны быть классифицированы с помощью модели классификации.
- Это правильный подход?
- Есть ли лучшие способы справиться с этим использованием?