Я пытаюсь построить многочленный классификатор NaiveBayes.Получая топ-10 функций для моих меток бинарных классов, я обнаружил, что 8 функций помечены как положительные и отрицательные.Разве это не существенная ошибка неправильной классификации.
feature_names = mnbayes.count_vect.get_feature_names()
top10_negve = np.argsort(mnbayes_clf.feature_log_prob_[0])[-10:]
print(top10_negve)
print("%s: %s" % (0,
" ".join(feature_names[j] for j in top10_negve)))
ВЫХОД
[6384 6189 309 10536 4036 3686 9380 7197 5324 6222]
0: ни один из амазонок не будет иметь хорошего вкуса, как не
top10_posve = np.argsort(mnbayes_clf.feature_log_prob_[1])[-10:]
print(top10_posve)
print("%s: %s" % (1,
" ".join(feature_names[j] for j in top10_posve)))
OUTPUT
[6384 7197 5467 10536 3602 9380 4129 4036 5324 6222]
1: один продукт любви будет очень приятным на вкус, как не
Я создаюBOW, а затем векторизация текста.
С помощью моих тестовых данных я получаю оценку точности 0,90%.
Вопрос
На что мне обращать внимание или что происходитнеправильно ?Какую часть кода мне нужно отобразить, чтобы получить помощь в этой ситуации?