Да, вы можете использовать модель для тестирования аналогичных наборов данных.
Однако вы должны помнить об этапе предварительной обработки в соответствии с моделью.
Когда вы обучали свою модель, это было обучены конкретному измерению, и размер ввода был бы AxB matri c. Когда у вас есть новое тестовое предложение или новый набор данных, вы должны сначала выполнить ту же предварительную обработку, в противном случае это вызовет ошибки несоответствия размеров.
Пример:
предположим, что у вас есть следующий объект векторизатора счетчика
cv = CountVectorizer()
, тогда вы должны сначала поместить его в свой обучающий набор данных, например,
X = dataframe['text_column_name']
X = cv.fit_transform(X) # Fit the Data
Как только это будет сделано, когда у вас появится новое предложение, скажем
test_sentence = "this is a test sentence"
, тогда вы должны использовать объект cv следующим образом
model_input = cv.transform([test_sentence]).toarray()
, а затем вы можете делать прогнозы:
model.predict(model_input)
Этому методу необходимо следовать, даже если вы sh для тестирования нового набора данных, который находится во фрейме данных или другом формате файла.