Вернуть необработанные вероятности гауссовского наивного байесовского склеарна - PullRequest
0 голосов
/ 31 октября 2018

Я использую GaussianNB Scikit-Learn, чтобы сделать контролируемую классификацию. При использовании метода «gnestt_proba »сумма вероятностей всегда равна 1.

То, что я хотел бы вернуть, - это реальное значение подобранного гауссовского распределения, потому что мой набор данных содержит много выбросов. Если бы у меня было 3 идентифицированных категории, я бы хотел, чтобы модель говорила мне: «10% относятся к категории A, 0,5% относятся к категории B и 4% к категории C». Другими словами, это скорее всего выброс.

Склеарн также возвращает этот результат? Должен ли я сделать математику на основе среднего и стандартного отклонения?

1 Ответ

0 голосов
/ 08 ноября 2018

Решение, которое я наконец-то использовал, следующее:

gaussian_model = naive_bayes.GaussianNB()
jll = gaussian_model._joint_log_likelihood(X) 
raw_proba = np.exp(jll)

raw_proba не между 0 и 1, но так как я хочу оценивать только результаты, меня не волнует сама цифра.

...