У меня есть следующие сомнения:
Я использую функцию k-средних в Matlab, и я просто хочу использовать алгоритм ванильного Ллойда с моим желаемым набором точек инициализации. Я использую следующий код, где «start» - мой вектор инициализации
kmeans(data,[],'Start',start, 'OnlinePhase', 'off');
Предположим, мои данные двумерные в диапазоне (-2, -1) X (2,1), и я инициализирую свои начальные точки в (-10,0) и (0,0). В идеале я должен получить все точки в одном кластере, а не в другом, но я получаю два кластера в ответе (так как (-10,0) действительно далеко, поэтому он должен сходиться за одну итерацию). Как это возможно? Я прочитал описание алгоритма k-средних на сайте Matlab, и кажется, что это не должно быть ответом.
![k-means, original data and clustered data](https://i.stack.imgur.com/gR1u0.jpg)