Работая с Python, мне нужно создать две новые переменные.
Один (см. JourneyID в примере), который кумулятивно увеличивается на единицу каждый раз, когда предыдущая строка другого столбца принимает значение «1», и
Один (см. JourneyN в примере), который кумулятивно увеличивается по одному каждый раз, когда предыдущая строка другого столбца принимает значение «1», но начинается с 1 каждый раз, когда ID респондента увеличивается на 1.
m = df['Purpose'] == 1
df.loc[m, 'JourneyID'] = m.cumsum()
Возвращает df [JourneyID] = [1,1 , 1,2,1,1,3,1,4] когда он должен вернуть [1,1,2,2,3,3,3,4,4] для ID.
Любая помощь с благодарностью.