Scikit учить MultinomialNaiveBayes Misclassification - PullRequest
0 голосов
/ 01 марта 2019

Я пытаюсь построить многочленный классификатор NaiveBayes.Получая топ-10 функций для моих меток бинарных классов, я обнаружил, что 8 функций помечены как положительные и отрицательные.Разве это не существенная ошибка неправильной классификации.

feature_names = mnbayes.count_vect.get_feature_names()

top10_negve = np.argsort(mnbayes_clf.feature_log_prob_[0])[-10:]
print(top10_negve)
print("%s: %s" % (0,
    " ".join(feature_names[j] for j in top10_negve)))

ВЫХОД
[6384 6189 309 10536 4036 3686 9380 7197 5324 6222]
0: ни один из амазонок не будет иметь хорошего вкуса, как не

top10_posve = np.argsort(mnbayes_clf.feature_log_prob_[1])[-10:]
print(top10_posve)
print("%s: %s" % (1,
    " ".join(feature_names[j] for j in top10_posve)))

OUTPUT
[6384 7197 5467 10536 3602 9380 4129 4036 5324 6222]

1: один продукт любви будет очень приятным на вкус, как не

Я создаюBOW, а затем векторизация текста.
С помощью моих тестовых данных я получаю оценку точности 0,90%.

Вопрос
На что мне обращать внимание или что происходитнеправильно ?Какую часть кода мне нужно отобразить, чтобы получить помощь в этой ситуации?

...