Найдены входные переменные с непоследовательным количеством образцов, склеарн конвейеризован - PullRequest
0 голосов
/ 22 марта 2020

вот проблеск моих данных. я скачал данные с https://www.kaggle.com/rmisra/news-category-dataset

enter image description here

x_train.shape
(140597, 2)

y_train.shape
(140597,)

код:

from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.pipeline import Pipeline
from sklearn.feature_extraction.text import TfidfTransformer
​
nb = Pipeline([('vect', CountVectorizer()),
               ('tfidf', TfidfTransformer()),
               ('clf', MultinomialNB()),
              ])

это мой код, но когда я вызываю функцию nb.fit(x_train, y_train), я получаю сообщение об ошибке:

Found input variables with inconsistent numbers of samples
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...