Предсказать мультикласс в SVM - PullRequest
0 голосов
/ 13 февраля 2019

У меня есть набор данных отзывов пользователей, например

review-1, 0,1,1,0,0

review-1 - это отзывы пользователей, а 0,1,1,0,0 - категории отзывов.один обзор может иметь несколько категорий.Я хочу прогнозировать категории для обзоров.поэтому я реализую код, который

transformer = TfidfVectorizer(lowercase=True, stop_words=stop, max_features=500)
X = transformer.fit_transform(df.Review)

X_train, X_test, y_train, y_test = train_test_split(X, df.iloc[:, 1:6],
                                                test_size=0.25, random_state=42)

SVM = svm.SVC()
SVM.fit(X_train, y_train)

Но я получаю сообщение об ошибке вроде

ValueError: bad input shape (75, 5)

Может кто-нибудь предложить какое-нибудь хорошее решение для решения этой проблемы?

1 Ответ

0 голосов
/ 13 февраля 2019

Вы можете использовать двоичный классификатор (например, svm.SVC()) для решения проблемы классификации по нескольким меткам, используя OneVsRestClassifier.

Пример:

from sklearn.multiclass import OneVsRestClassifier

from sklearn.svm import SVC

cls = OneVsRestClassifier(estimator=SVC(gamma ='auto'))

import numpy as np
cls.fit(np.random.rand(20,10),np.random.binomial(1,0.2,size=(20,5)))
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...