Наивный байесовский многочлен NB ValueError: несоответствие размеров - PullRequest
0 голосов
/ 27 мая 2020

Итак, я использую Naive Bayes MultinomialNB для прогнозирования настроений в твиттере, у меня есть как обучающие, так и тестовые данные, и я уже обучил модель на обучающих данных. то я пытаюсь предсказать с помощью тестовых данных, но он говорит об ошибке измерения. Как я могу это решить?

from sklearn.naive_bayes import MultinomialNB
pf = pd.read_csv('/content/train.csv')
from sklearn.feature_extraction.text import TfidfVectorizer
tfidf_vectorizer = TfidfVectorizer()
tfidf = tfidf_vectorizer.fit_transform(pf.original_text)
model = MultinomialNB()
model.fit(tfidf,pf.sentiment_class)
test_csv = pd.read_csv("/content/test.csv")    
test_tfidf = tfidf_vectorizer.transform(test_csv['original_text'])

test_tfidf.toarray()

array([[0.        , 0.        , 0.        , ..., 0.15573603, 0.        ,
        0.        ],
       [0.2400925 , 0.        , 0.        , ..., 0.        , 0.        ,
        0.        ],
       [0.        , 0.        , 0.        , ..., 0.        , 0.46763784,
        0.        ],
       ...,
       [0.        , 0.        , 0.        , ..., 0.        , 0.        ,
        0.        ],
       [0.        , 0.        , 0.        , ..., 0.        , 0.182512  ,
        0.        ],
       [0.        , 0.        , 0.        , ..., 0.        , 0.42798355,
        0.        ]])

поэтому, когда я использую модель для прогнозирования, возникает ошибка измерения.

model.predict(test_tfidf)

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

<ipython-input-90-34ca51ed204c> in <module>()
----> 1 model.predict(test_tfidf)

4 frames

/usr/local/lib/python3.6/dist-packages/scipy/sparse/base.py in __mul__(self, other)
    518 
    519             if other.shape[0] != self.shape[1]:
--> 520                 raise ValueError('dimension mismatch')
    521 
    522             result = self._mul_multivector(np.asarray(other))

ValueError: dimension mismatch
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...