Question

Я хочу использовать scikit kmean в производственном развертывании и хотел бы использовать настройку по умолчанию для kmean.init = k-means ++.У меня такой вопрос: каковы шансы, что kmeans попадет в локальную оптиму, когда он инициализирует кластерные центроиды?

В Notes говорится, что «k-means ++»: разумно выбирает начальные центры кластеров для кластеризации k-mean для ускорения сходимости. Для получения дополнительной информации см. Раздел Notes в k_init ».

Есть ли данные о вероятности получения локального оптимума?Если это так, я должен повторить, чтобы получить функцию минимальной стоимости?

ai_learning · Answer 1 · 27 декабря 2018

Вероятность попасть в локальную оптиму, в основном, зависит от характера ваших данных.Если его явно сгруппировать, то первоначальный кластер может не сильно повлиять на конечные результаты кластеров. Может быть полезно для вас .

Несмотря на вышеприведенную точку, для набора данных большого размера предпочтительнее попробовать 10 или более итераций с различными исходными кластерами и выбрать ту, которая имеет лучшую производительность (один из показателей производительности может быть силуэт-коэффициент )

Как избежать Kmean местных оптимумов при использовании sklearn Kmeans

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как избежать Kmean местных оптимумов при использовании sklearn Kmeans

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы