Я хочу создать N групп из кадра данных, но, учитывая, что значения групп должны быть близки к среднему.
Это заголовок моего кадра данных:

, который имеет 61 ряд.И я хочу, чтобы среднее значение каждой группы в столбце «кластер» было похоже на остальные группы.
Я попытался разделить фрейм данных с помощью:
df_out = np.array_split(cluster_map, 14)
но я получаю это на выходе
df_out = np.array_split(cluster_map, 14)
print df_out[0]['cluster'].mean()
print df_out[1]['cluster'].mean()
print df_out[2]['cluster'].mean()
print df_out[3]['cluster'].mean()
print df_out[4]['cluster'].mean()
print df_out[5]['cluster'].mean()
print df_out[6]['cluster'].mean()
print df_out[7]['cluster'].mean()
print df_out[8]['cluster'].mean()
print df_out[9]['cluster'].mean()
print df_out[10]['cluster'].mean()
print df_out[11]['cluster'].mean()
print df_out[12]['cluster'].mean()
print df_out[13]['cluster'].mean()
[Out]
1.2
1.6
1.4
1.0
1.2
1.5
3.75
0.5
1.25
2.0
1.0
2.25
1.0
1.0
, где средства столбца 'cluster' не сбалансированы.Я хочу, чтобы эти значения были как можно ближе друг к другу, и постараюсь, чтобы в каждой группе было одинаковое количество элементов.
Есть ли способ сделать это на кадре данных ?.
Спасибо:)