«ValueError: мультиклассовый формат не поддерживается» roc_auc_score - PullRequest
1 голос
/ 30 января 2020

Я пытался провести анализ настроений в твиттере. Я немного новичок в кодировании, поэтому собираюсь пройти курс обучения. Таким образом, мой CSV-файл в основном состоит из двух столбцов. Один из них - твиты, а другой - чувства.

from sklearn.model_selection import train_test_split
y = train_tweets.Sentiment
X= train_tweets.Tweets
train_X, val_X, train_y, val_y = train_test_split(X, y, random_state=0)

from sklearn.feature_extraction.text import CountVectorizer
cv = CountVectorizer(encoding='iso-8859-9').fit(train_X)
train_X_cv = cv.transform(train_X)

from sklearn.linear_model import LogisticRegression
import warnings
warnings.filterwarnings("ignore", category=FutureWarning)
model = LogisticRegression()
model.fit(train_X_cv, train_y)

from sklearn.metrics import roc_auc_score
prediction = model.predict(cv.transform(val_X))
print('AUC: ', roc_auc_score(val_y, prediction))

Мой код выглядит следующим образом. Когда я пытаюсь запустить этот код, я получаю сообщение об ошибке «ValueError: мультиклассовый формат не поддерживается». Ты хоть представляешь, что мне делать?

Спасибо!

...