K-means предназначен для минимизации суммы квадратов .
Имеет ли смысл минимизацию суммы квадратов для вашей проблемы?Вероятно, нет!
Хотя 29, 2903 и 2930, предположительно, связаны между собой, все 2899, вероятно, не очень связаны с 2900. Следовательно, метод наименьших квадратов даст нежелательные результаты.
Метод действительно предназначен для непрерывных переменных одного типа и масштаба.Переменные в горячем виде вызывают больше проблем, чем решают - это наивный хак, чтобы заставить функцию «работать», но результаты статистически сомнительны.
Попробуйте выяснить, что он вправо что нужно сделать, это.Здесь, наверное, не наименьшие квадраты.