Преобразование невидимых данных в TFIDF перед запуском через классификатор - PullRequest
0 голосов
/ 23 октября 2018

У меня есть текстовые данные, которые я сначала конвертирую в матрицу TFIDF, а затем обучаю их.Я использую библиотеку Scikit для преобразования текстовых данных в матрицу TF-IDF.Я не сохраняю модель и не тренирую ее каждый раз, когда необходимо классифицировать невидимые данные.Мне нужны предложения для создания матрицы TF-IDF из невидимых данных.Один из подходов, о котором я думаю, - это создание матрицы TF-IDF вместе с невидимыми данными, а затем создание модели с использованием обучающих данных и прохождение матрицы TFIDF невидимых данных, которые должны быть классифицированы с помощью модели классификации.

  1. Это правильный подход?
  2. Есть ли лучшие способы справиться с этим использованием?
...