Должен ли BIC (байесовский информационный критерий) быть ниже или выше - PullRequest
0 голосов
/ 03 июля 2018

Я очень озадачен графиками BIC и количеством компонентов в GMM. Документация Python говорит, что чем меньше, тем лучше, но на некоторых сайтах я читал, что правильное количество кластеров - это первое местоположение локальных максимумов !!!

Может ли кто-нибудь уточнить, использует ли Python другие уравнения, возможно, со знаком минус, умноженным на уравнение оценки BIC?

1 Ответ

0 голосов
/ 03 июля 2018

Кажется, определение BIC меняется в разных источниках. Вот исходный код метода BIC:

    def bic(self, X):
    . . . 
    return (-2 * self.score(X) * X.shape[0] +
            self._n_parameters() * np.log(X.shape[0]))

По мере того, как сложность модели увеличивается, значение bic увеличивается, а с увеличением вероятности bic уменьшается. Итак, чем ниже, тем лучше. Это определение совпадает с формулой , связанной со страницей википедии .

Кроме того, я нашел это примечание на странице википедии, которое может объяснить, почему это определение не соответствует тому, что вы ожидали:

ПРИМЕЧАНИЕ. AIC, AICc и BIC, определенные Claeskens и Hjort (2008), являются отрицательными значениями, определенными в этой статье и в большинстве других стандартных ссылок.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...