Гарантируется ли сходимость алгоритма Kmeans независимо от того, как инициализированы центры кластера? Зачем? - PullRequest
1 голос
/ 07 мая 2020

K-means - это итерационный алгоритм, который случайным образом инициализирует центры кластеров. Гарантируется ли сходимость алгоритма Kmeans независимо от того, как инициализированы центры кластера? Почему?

1 Ответ

3 голосов
/ 07 мая 2020

Да. Он сходится, но не охватывает один и тот же результат, а не покрытие с одинаковой скоростью. Это математически доказывает, что повторный поиск центров в k-средних сходится. Причина в том, что:

На каждой итерации k-средних сумма расстояний до центра уменьшается. Это связано с тем, как выбирается центр (центр кластера - это среднее значение каждого узла кластера) на каждой итерации. Таким образом, поскольку сумма расстояний уменьшается на каждой итерации (поскольку вы присваиваете каждый узел ближайшему центру), алгоритм сходится. как я сказал ранее, эта сходимость имеет математическое доказательство. K-means - это разновидность алгоритма ожидания-максимизации (EM), и каждый алгоритм EM сходится. (Вы можете увидеть это доказательство, и если вам интересно, я могу объяснить его больше, используя математические формулы.)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...