Нахождение распространения каждого кластера от Kmeans - PullRequest
3 голосов
/ 23 февраля 2010

Я пытаюсь определить, насколько хорошо входной вектор соответствует данному центру кластера. Я могу найти лучшее совпадение довольно легко (центр с минимальным евклидовым расстоянием до входного вектора является лучшим), однако теперь мне нужно поработать над тем, насколько это хорошее совпадение.

Для этого мне нужно найти разброс (стандартное отклонение?) Векторов, которые образуют центроид, а затем посмотреть, меньше ли расстояние от моего входного вектора до центра, чем разброс. Если это больше, чем спред, я должен сказать, что у меня нет кластеров, чтобы соответствовать ему (учитывая, что лучший не подходит к входному вектору).

Я не уверен, как найти спред на кластер. У меня есть все центральные векторы, и все обучающие векторы помечены их ближайшим кластером, я просто не могу точно понять, что мне нужно сделать, чтобы получить спред.

Надеюсь, это понятно? Если нет, я постараюсь перефразировать это! ТИА Ian

Ответы [ 2 ]

4 голосов
/ 23 февраля 2010

Используйте функцию расстояния и рассчитайте расстояние от вашей центральной точки до каждой маркированной точки, затем вычислите среднее значение этих расстояний. Это должно дать вам стандартное отклонение.

1 голос
/ 20 ноября 2013

Если вы переключитесь на другой алгоритм, такой как смесь гауссианов, вы получите спред (например, стандартное отклонение) как часть модели (результат кластеризации).

http://home.deib.polimi.it/matteucc/Clustering/tutorial_html/mixture.html

http://en.wikipedia.org/wiki/Mixture_model

...