Я использую TF-idf, чтобы извлечь некоторые функции из текста, а затем обучить машину этому.после прогнозирования мне нужно объединить прогнозируемые значения в исходный фрейм данных.
Я использую train_test_split так:
X = tfidf_vectorizer_vectors
y = labels
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=101)
и мой набор данных примерно так:
Text Label
'hello, its a text ....' 1
'how are you ....' 0
после вычисления TF-idf и train_test_split на самом деле я не знаю, какой прогноз для какого столбца.