У меня есть фрейм данных, подобный этому.
Я ищу способ обучить этот набор данных, поэтому я попробовал его с помощью sklearn с этим кодом
train_x, test_x, train_y, test_y = train_test_split(df[['city','text']], df[['1','2','3','4']], test_size = 0.40, random_state = 21)
count_vect = CountVectorizer(analyzer='word', ngram_range=(2,3), max_features=20000)
count_vect.fit(df['text'])
x_train = count_vect.transform(train_x)
x_test = count_vect.transform(test_x)
classifier = DecisionTreeClassifier()
classifier.fit(x_train, train_y)
но я получил такую ошибку
ValueError: Number of labels=2348 does not match number of samples=1
на самом деле я не знаю, нормально ли это, чтобы тренировать мои данные с 4 метками напрямую