Question

• 1000 * Но когда он используется с Gaussian NB, он не дает в сумме 1.

То же самое происходит и с ближайшим соседом.

Вы хоть представляете, почему это происходит и что можно сделать, чтобы определить степень достоверности?

Savage Henry · Answer 1 · 22 июня 2020

Я думаю, если вы присмотритесь, вы увидите, что прогнозируемые вероятности для двух классов в сумме составляют ~ 1 с учетом ошибок округления и числовых c приближений в процессе NB. Например, для каждой строки, где один класс равен ~ = 1.00000000, значение другого класса исчезающе мало.

Во-вторых, в этом случае трудно понять, чего вы хотите от «уверенности». Многие инструменты классификации в sklearn имеют метод decision_function(), который дает вам расстояние оценки от границы решения. В этом случае граница принятия решения является функцией выбранного вами типа NB (гауссовский). Я думаю, это объяснение построения границы могло бы быть очень полезным.

Но более тщательный поиск SO дал бы вам этот вопрос , который, я думаю, мог бы получить ближе к тому, что вы ищете.

Почему функция pred_proba не дает суммирования до 1 в наивном байесовском методе

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Почему функция pred_proba не дает суммирования до 1 в наивном байесовском методе

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы