Как подобрать тестовый набор к тренировочному набору? - PullRequest
0 голосов
/ 06 августа 2020

Я векторизовал корпус, содержащий текст и настроения, используя что-то вроде TF-IDF. Как должны выглядеть тестовые данные, чтобы я мог передать их классификатору? пример текста и настроения:

text = 'Продукты Apple хорошего качества.' сантимент = 'положительный'

import pandas as pd

dataset1 = pd.read_csv("output(feature_space).csv")
dataset2 = pd.read_csv("test.csv")

X = dataset1.drop('Sentiment', axis=1)
y = dataset1['Sentiment']

X_train = X
y_train = y

X_test = dataset2['Sentiment']
y_test = dataset2['text']
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...