Итак, я использую Naive Bayes MultinomialNB для прогнозирования настроений в твиттере, у меня есть как обучающие, так и тестовые данные, и я уже обучил модель на обучающих данных. то я пытаюсь предсказать с помощью тестовых данных, но он говорит об ошибке измерения. Как я могу это решить?
from sklearn.naive_bayes import MultinomialNB
pf = pd.read_csv('/content/train.csv')
from sklearn.feature_extraction.text import TfidfVectorizer
tfidf_vectorizer = TfidfVectorizer()
tfidf = tfidf_vectorizer.fit_transform(pf.original_text)
model = MultinomialNB()
model.fit(tfidf,pf.sentiment_class)
test_csv = pd.read_csv("/content/test.csv")
test_tfidf = tfidf_vectorizer.transform(test_csv['original_text'])
test_tfidf.toarray()
array([[0. , 0. , 0. , ..., 0.15573603, 0. ,
0. ],
[0.2400925 , 0. , 0. , ..., 0. , 0. ,
0. ],
[0. , 0. , 0. , ..., 0. , 0.46763784,
0. ],
...,
[0. , 0. , 0. , ..., 0. , 0. ,
0. ],
[0. , 0. , 0. , ..., 0. , 0.182512 ,
0. ],
[0. , 0. , 0. , ..., 0. , 0.42798355,
0. ]])
поэтому, когда я использую модель для прогнозирования, возникает ошибка измерения.
model.predict(test_tfidf)
---------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-90-34ca51ed204c> in <module>()
----> 1 model.predict(test_tfidf)
4 frames
/usr/local/lib/python3.6/dist-packages/scipy/sparse/base.py in __mul__(self, other)
518
519 if other.shape[0] != self.shape[1]:
--> 520 raise ValueError('dimension mismatch')
521
522 result = self._mul_multivector(np.asarray(other))
ValueError: dimension mismatch