Я хотел бы рассчитать среднее значение «бонуса» по столбцу «first_name», но знаменатель не является суммой наблюдений, потому что не все наблюдения имеют вес 1, а могут иметь вес 0,5.
например, в случае с Джейсоном желаемое значение - это сумма его бонуса, деленная на 2,5.
Так как в реальной жизни мне приходится группировать по нескольким столбцам, таким как area, et c, я бы хотел адаптировать группу к этой ситуации.
Вот моя попытка, но она дает мне нормальное среднее значение
raw_data = {'area': [1,2,3,3,4],'first_name': ['Jason','Jason','Jason', 'Jake','Jake'],
'bonus': [10,20, 10, 30, 20],'weight': [1,1,0.5,0.5,1]}
df = pd.DataFrame(raw_data, columns = ['area','first_name','bonus','weight'])
df