Я векторизовал корпус, содержащий текст и настроения, используя что-то вроде TF-IDF. Как должны выглядеть тестовые данные, чтобы я мог передать их классификатору? пример текста и настроения:
text = 'Продукты Apple хорошего качества.' сантимент = 'положительный'
import pandas as pd
dataset1 = pd.read_csv("output(feature_space).csv")
dataset2 = pd.read_csv("test.csv")
X = dataset1.drop('Sentiment', axis=1)
y = dataset1['Sentiment']
X_train = X
y_train = y
X_test = dataset2['Sentiment']
y_test = dataset2['text']