Почему функция pred_proba не дает суммирования до 1 в наивном байесовском методе - PullRequest
0 голосов
/ 20 июня 2020
• 1000 * Но когда он используется с Gaussian NB, он не дает в сумме 1.

nb- pred_proba результаты

То же самое происходит и с ближайшим соседом.

Вы хоть представляете, почему это происходит и что можно сделать, чтобы определить степень достоверности?

1 Ответ

0 голосов
/ 22 июня 2020

Я думаю, если вы присмотритесь, вы увидите, что прогнозируемые вероятности для двух классов в сумме составляют ~ 1 с учетом ошибок округления и числовых c приближений в процессе NB. Например, для каждой строки, где один класс равен ~ = 1.00000000, значение другого класса исчезающе мало.

Во-вторых, в этом случае трудно понять, чего вы хотите от «уверенности». Многие инструменты классификации в sklearn имеют метод decision_function(), который дает вам расстояние оценки от границы решения. В этом случае граница принятия решения является функцией выбранного вами типа NB (гауссовский). Я думаю, это объяснение построения границы могло бы быть очень полезным.

Но более тщательный поиск SO дал бы вам этот вопрос , который, я думаю, мог бы получить ближе к тому, что вы ищете.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...