Question

Я хочу создать некоторую сумму моих данных, которая может иметь вид:

Я хочу сгруппировать эти строки на основе значений столбца B путем их квантования в группы из диапазона 5. Поэтому, если какое-либо значение столбца B попадает в диапазон 1-5 , строка будет принадлежать этой группе.В этом примере строки 1 и 2 попадают в группу 1-5 , тогда как 3 и 4 принадлежатв группу 6-10 .Каждая группа станет только одной строкой, содержащей значения столбца A .Итак, в итоге мы получим

A    B
------
15  1-5
5   6-10
9   11-15

Как это можно сделать с пандами, без итерации по каждой строке?

jezrael · Answer 1 · 18 октября 2018

Используйте cut с arange для корзин с пониманием списка для меток и затем агрегируйте mean:

bins = np.arange(0, 16, 5)
labels = [f'{i+1}-{j}' for i, j in zip(bins[:-1], bins[1:])] 

binned = pd.cut(df['B'], bins=bins, labels=labels)
df1 = df.groupby(binned)['A'].mean().reset_index()[['A','B']]
print (df1)

    A      B
0  15    1-5
1   5   6-10
2   9  11-15

Квантовать значения строк в группы и вычислять среднее значение для каждой группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Квантовать значения строк в группы и вычислять среднее значение для каждой группы

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов