Я прочитал, и я думаю, что ответом на это может быть: - В kmeans мы пытаемся разделить данные в соответствии со средствами, так как данные поступают так теоретически, наш лучший набор данных будет там, где каждый раздел имеет равное количество данных.
Я использовал kmeans ++, который был лучшим алгоритмом, чем kmeans, потому что он не инициализировал случайное значение, а затем итерировал по числу секций до тех пор, пока размеры секций не были почти равны.Это была приблизительная цифра, как, скажем, для 3, я получил 2180,729,1219, а для 4 я получил 30,2422, 1556,120, поэтому я выбрал 3 в качестве окончательного ответа ............