Как избежать Kmean местных оптимумов при использовании sklearn Kmeans - PullRequest
0 голосов
/ 27 декабря 2018

Я хочу использовать scikit kmean в производственном развертывании и хотел бы использовать настройку по умолчанию для kmean.init = k-means ++.У меня такой вопрос: каковы шансы, что kmeans попадет в локальную оптиму, когда он инициализирует кластерные центроиды?

В Notes говорится, что «k-means ++»: разумно выбирает начальные центры кластеров для кластеризации k-mean для ускорения сходимости. Для получения дополнительной информации см. Раздел Notes в k_init ».

Есть ли данные о вероятности получения локального оптимума?Если это так, я должен повторить, чтобы получить функцию минимальной стоимости?

1 Ответ

0 голосов
/ 27 декабря 2018

Вероятность попасть в локальную оптиму, в основном, зависит от характера ваших данных.Если его явно сгруппировать, то первоначальный кластер может не сильно повлиять на конечные результаты кластеров. Может быть полезно для вас .

Несмотря на вышеприведенную точку, для набора данных большого размера предпочтительнее попробовать 10 или более итераций с различными исходными кластерами и выбрать ту, которая имеет лучшую производительность (один из показателей производительности может быть силуэт-коэффициент )

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...