У меня есть pandas df, в котором у меня есть категориальный столбец, а затем различные столбцы, которые имеют c - мне нужно вычислить различные значения, но для подмножества df, где категория такая же:
Type | num1 | num2
a | 10 | 10
a | 5 | 10
a | 1 | 30
b | 5 | 10
...
Здесь я хотел бы вычислить%, которое составляет каждое значение от общего количества этого типа
Таким образом, результат будет:
Type | num1 | num2 | num2_pct
a | 10 | 10 | 20
a | 5 | 10 | 20
a | 1 | 30 | 60
...
Это вычисление будет происходить для каждого значения в столбце type
.
Я пытался использовать df.loc
и писать al oop, создавая новый DF и затем объединяя их - но это не может быть правильным способом !