Как я могу перечислить строки в наборе тестов, которые были предсказаны неправильно? - PullRequest
0 голосов
/ 17 мая 2018

Мы используем такой код для измерения точности, но я хотел проверить, какие предсказания строк были неверными. Как я могу сделать такую ​​вещь?

text_mnb_lemmatized = Pipeline([('vect', lemma_count_vect), 
                                ('tfidf', TfidfTransformer(sublinear_tf=True, use_idf=False)), 
                             ('mnb', MultinomialNB(alpha=0.1, fit_prior=True))])

text_mnb_lemmatized = text_mnb_lemmatized.fit(train_data['CDESCR'], train_data['COMPID'])

predicted_mnb_lemmatized = text_mnb_lemmatized.predict(test_data['CDESCR'])

np.mean(predicted_mnb_lemmatized == test_data['COMPID'])

1 Ответ

0 голосов
/ 17 мая 2018

при условии, что test_data - это фрейм данных Pandas:

test_data[predicted_mnb_lemmatized != test_data['COMPID']]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...