Алгоритм случайной кластеризации - PullRequest
0 голосов
/ 09 мая 2011

У меня есть множество точек, и я хочу, чтобы из них были кластеры. Я знаю, как сделать нормальный алгоритм k-средних. Но я не хочу принимать «к» в качестве входных данных. Предположим, если у меня есть такие точки, как 1,3,4,50,60,70,1000,10002,10004 алгоритм должен кластеризовать их в 3 кластера C1: 1,3,4 С2: 50,60,70 С3: 1000 1002 1004 удовлетворяющее расстояние между внутрикластерными элементами должно быть минимальным, а расстояние между межкластерными должно быть максимальным.

Ответы [ 2 ]

0 голосов
/ 09 мая 2011

Выбор k - это проблема, которая повторяется со многими алгоритмами кластеризации.Возможно, вы захотите рассмотреть спектральную кластеризацию (и ее различные алгоритмические кузены), которая может решить эту проблему.Тем не менее, во многих версиях в качестве заключительного шага используется k-означает, что вы возвращаетесь на круги своя (хотя и не все).

В качестве альтернативы существует множество подходов для нахождения оптимального значения k, например, ответ, предоставленныйДенис выше;этого может быть достаточно для ваших целей.

0 голосов
/ 09 мая 2011
...