Question

Каков наилучший способ кластеризации набора данных без меток и без представления о количестве требуемых кластеров?

Например, при использовании набора данных Iris без меток или знания количества классов меток.

Моя идея:

Вычислить среднеквадратичное расстояние от каждого из существующих кластеров для выборки
* Если среднеквадратичное расстояние> некоторый порог с коэффициентом, которыйзависит (штрафует) от k, затем добавьте «нового» кандидата.
* Если был добавлен новый кластер, найдите новый «лучший» k + 1 кластерных центров
Если нетдобавлен новый кластер, перейти к следующей строке

Anony-Mousse · Answer 1 · 04 декабря 2018

Были предложены десятки способов выбора k.

Некоторые варианты, такие как x-means, могут динамически регулировать k, вам нужно только дать максимум - и выбрать критерий качества AIC или BIC.

Ian Quah · Answer 2 · 03 декабря 2018

Что вы можете сделать, это построить кривую колена при разных значениях K, как описано здесь

В частности,

1) Идея коленаметод состоит в том, чтобы запустить кластеризацию k-средних в наборе данных для диапазона значений k (скажем, k от 1 до 10 в приведенных выше примерах) и для каждого значения k вычислить сумму квадратов ошибок (SSE).

2) Затем постройте линейную диаграмму SSE для каждого значения k.Если линейный график выглядит как рука, то «локоть» на руке является лучшим значением k *

3) Поэтому наша цель состоит в том, чтобы выбрать небольшое значение k, которое все еще имеет низкое значениеSSE, и локоть обычно представляет, где мы начинаем иметь уменьшающуюся отдачу, увеличивая k

Обновление значения K в кластеризации K-средних

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Обновление значения K в кластеризации K-средних

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы