У меня dataframe
вот так,
ID,CLASS_ID,ACTIVE
1,123,0
2,123,0
3,456,1
4,123,0
5,456,1
11,123,1
18,123,0
7,456,0
19,123,0
8,456,1
Я пытаюсь получить кумулятивное число CLASS_ID
, имеющее то же значение для ACTIVE
.В случае приведенного выше кадра данных, CLASS_ID
постоянно имеет ACTIVE
как 0
, до 4-й записи записи, следующее значение которой равно 1. Таким образом, до 4-й записи число должно быть 3. Этот процесс должен быть продолжени счетчик должен сбрасываться каждый раз, когда значение ACTIVE
изменяется для CLASS_ID
Ожидаемый результат следующий:
ID,CLASS_ID,ACTIVE,ACTIVE_COUNT
1,123,0,3
2,123,0,3
3,456,1,2
4,123,0,3
5,456,1,2
11,123,1,1
18,123,0,2
7,456,0,1
19,123,0,2
8,456,1,1
Я пытался использовать df.groupby(..).transform(..)
, но у меня не получилось,Может ли кто-нибудь мне немного помочь?