Не используйте k-means для таких данных.
Вы не можете получить значимый статистический анализ только методом проб и ошибок.Потому что есть много способов получить результат, который выглядит хорошо, но совершенно необоснованно.
Прежде чем использовать какой-либо из этих подходов, вам необходимо понять , что он делает.В случае k-средних он минимизирует наименьшие квадраты, что, очевидно, имеет смысл только для непрерывных переменных.Они также должны вести себя линейно.Если у вас есть несколько переменных, они также должны иметь одинаковую величину.
Это не метод черного ящика.Если вы используете его плохо, вы просто получите мусор.