Question

Я использую пополам K-средства, которые используют k-средних с k = 2, и я столкнулся только с 1 точкой данных в 1 кластере. Означает ли это, что процесс K-Means должен остановиться, потому что он достиг сходимости, или я должен начать процесс алгоритма заново с новыми значениями?

Anony-Mousse · Answer 1 · 24 ноября 2019

1-элементные кластеры довольно часто встречаются в k-средних на грязных данных.

Поскольку k-means минимизирует квадратов ошибок , назначение точек выброса для их собственного кластера дает "оптимальные" результатыпо отношению к квадрату ошибки цели. Так что часто является правильным результатом - это просто не то, что пользователь действительно хотел . Часто пользователь предпочел бы неквадратную оптимизацию (например, с использованием PAM) или метод, который имеет понятие «шумовых» точек, которые не принадлежат кластеру (например, DBSCAN).

Что делать, если в кластере K-Means есть только одна точка данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Что делать, если в кластере K-Means есть только одна точка данных?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы