Question

У меня есть образец DF:

df = pd.DataFrame(np.random.randint(0,10,size=(5, 1)), columns=list('A'))
df["B"] = ["apple","apple","orange","orange","orange"]
df

Op:

    A    B
 0  4   apple
 1  2   apple
 2  2   orange
 3  1   orange
 4  8   orange

Я пытаюсь заменить значения столбца B на сумму (groupby (B))

df.groupby("B")["A"].sum()

OP:

B
apple      6
orange    11
Name: A, dtype: int64

Ожидаемый OP:

В настоящее время я использую итеративное решение для этого.Есть ли более лаконичный подход к пандам?Любое предложение по ПОДХОДУ было бы здорово.

Mohamed Thasin ah · Answer 1 · 26 ноября 2018

Другой способ сделать это без преобразования - использовать GroupBy, Sum + map. Попробуйте,

df["B"]=df["B"].map(df.groupby("B")["A"].sum())

Ввод:

   A       B
0  9   apple
1  2   apple
2  3  orange
3  8  orange
4  9  orange

Выход:

WeNYoBen · Answer 2 · 26 ноября 2018

Я думаю, что вы ищете transform sum

df.groupby('B').A.transform('sum')
0     7
1     7
2    12
3    12
4    12
Name: A, dtype: int32
#df['new']=df.groupby('B').A.transform('sum')

Панды заменяют ряды суммой

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.