Я очень плохо знаком с Python и пандами, работающими над кадром данных панд, который выглядит как
Date Time ID Weight
Jul-1 12:00 A 10
Jul-1 12:00 B 20
Jul-1 12:00 C 100
Jul-1 12:10 C 100
Jul-1 12:10 D 30
Jul-1 12:20 C 100
Jul-1 12:20 D 30
Jul-1 12:30 A 10
Jul-1 12:40 E 40
Jul-1 12:50 F 50
Jul-1 1:00 A 40
Я пытаюсь выполнить группировку по дате, времени и идентификаторам и применить кумулятивную сумму таким образом, чтобы, если идентификатор присутствовал в следующем интервале времени, вес добавлялся только один раз (однозначно). Результирующий кадр данных будет выглядеть следующим образом
Date Time Weight
Jul-1 12:00 130 (10+20+100)
Jul-1 12:10 160 (10+20+100+30)
Jul-1 12:20 160 (10+20+100+30)
Jul-1 12:30 160 (10+20+100+30)
Jul-1 12:40 200 (10+20+100+30+40)
Jul-1 12:50 250 (10+20+100+30+40+50)
Jul-1 01:00 250 (10+20+100+30+40+50)
Это то, что я попробовал ниже, однако это все еще учитывает веса несколько раз:
df=df.groupby(['date','time','ID'])['Wt'].apply(lambda x: x.unique().sum()).reset_index()
df['cumWt']=df['Wt'].cumsum()
Любая помощь будет очень признательна!
Большое спасибо заранее !!