ValueError: несоответствие измерения при прогнозировании анализа новых значений - PullRequest
0 голосов
/ 14 марта 2020

Я относительно новичок в предмете машинного обучения. Я пытаюсь сделать прогноз анализа настроения.

Тип столбца включает в себя настроение твита (положительный, отрицательный или нейтральный как 0,1 и 2). Колонка твитов включает твиты.

Я пытаюсь предсказать новый набор чувств твитов как 0,1 и 2.

Когда я написал приведенный здесь код, я получил ошибку несоответствия измерений.

import pandas as pd
train_tweets = pd.read_csv("tweets_type.csv")
from sklearn.model_selection import train_test_split

y = train_tweets.Type
X= train_tweets.Tweet

train_X, test_X, train_y, test_y = train_test_split(X, y, random_state=1)

from sklearn.feature_extraction.text import CountVectorizer

vect = CountVectorizer()

vect.fit(train_X)
train_X_dtm = vect.transform(train_X)

test_X_dtm = vect.transform(test_X)
test_X_dtm

from sklearn.naive_bayes import MultinomialNB
nb = MultinomialNB()

%time nb.fit(train_X_dtm, train_y)

# make class predictions for X_test_dtm
y_pred_class = nb.predict(test_X_dtm)

# calculate accuracy of class predictions
from sklearn import metrics
from sklearn.metrics import classification_report, confusion_matrix
metrics.accuracy_score(test_y, y_pred_class)

march_tweets = pd.read_csv("march_data.csv")
X=march_tweets.Tweet
vect.fit(X)
train_new_dtm = vect.transform(X)

new_pred_class = nb.predict(train_new_dtm)

Я получаю ошибку здесь:

enter image description here

Буду так рад, если вы поможете мне.

1 Ответ

0 голосов
/ 15 марта 2020

Кажется, я допустил ошибку при установке X после того, как уже установил train_X. Я обнаружил, что бесполезно делать это несколько раз, когда вы подгоняете модель. Поэтому я удалил эту строку, и она отлично заработала.

vect.fit(X)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...