1-элементные кластеры довольно часто встречаются в k-средних на грязных данных.
Поскольку k-means минимизирует квадратов ошибок , назначение точек выброса для их собственного кластера дает "оптимальные" результатыпо отношению к квадрату ошибки цели. Так что часто является правильным результатом - это просто не то, что пользователь действительно хотел . Часто пользователь предпочел бы неквадратную оптимизацию (например, с использованием PAM) или метод, который имеет понятие «шумовых» точек, которые не принадлежат кластеру (например, DBSCAN).