Question

Я пытаюсь использовать агломеративную кластеризацию для кластеризации некоторых данных, но я не знаю, какое количество кластеров идеально.Вот мои результаты:

База данных состоит из 65 классов, которые необходимо распознать.Значение Джини = 0,265.

Что должно быть выбрано для количества кластеров?Может быть, так же, как количество классов?
Что означает точка пересечения полноты и однородности и v меры?
Что означает максимум в скорректированном балле взаимной информации?

Anony-Mousse · Answer 1 · 17 ноября 2018

Не используйте эти меры для выбора k. Потому что они сравнивают с известным решением. Если у вас есть известное решение, зачем вместо этого выбирать приближение?
Возможно, просто совпадение. Но вы, возможно, захотите изучить уравнения, может быть, они согласны на этом этапе.
Для AMI, NMI, ARI и т. Д. Максимальное значение равно k с наибольшим соглашением с существующим маркированным решением.

Как интерпретировать оценки кластеризации Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как интерпретировать оценки кластеризации Python?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы