Полное размышление о мозге с тем, что должно быть простой рутиной панд, - но мне не повезло найти ответ.
У меня есть фрейм данных с тремя интересными для этого столбцами - пример ниже.
Все, что я хотел бы сделать, это добавить новый столбец с именем «Pct_Day», в котором берется процент от каждой суммы идентификационной даты и делится на общую сумму по всем идентификаторам на эту дату.
Таким образом, для приведенного ниже примера результат для первой строки (7/7/17, ID: 553, сумма: 3) будет равен 0,25000 (3 / (3 + 4 + 5))
Спасибо за вашу помощь - нужно вернуться на качелях Панд ...
df_dict={'DateOf': ['2017-08-07','2017-08-07','2017-08-07','2017-08-04','2017-08-04','2017-08-04'
, '2017-08-03','2017-08-03','2017-08-03'], 'ID': ['553','559','914','553','559','914','553','559','914'], 'Amount': [3, 4, 5, 9, 11, 10, 3, 9, 10]}
df=pd.DataFrame(df_dict)