У меня есть df
id, date, item
1, 20180101, A
1, 20180102, A
1, 20180103, B
1, 20180104, A
2, 20180101, C
2, 20180102, D
2, 20180103, D
2, 20180104, D
, и я хотел бы создать новый столбец streak
, который содержит количество серий элементов, которые есть у каждого пользователя
id, date, item, streak
1, 20180101, A, 1
1, 20180102, A, 2
1, 20180103, B, 1
1, 20180104, A, 1
2, 20180101, C, 1
2, 20180102, D, 1
2, 20180103, D, 2
2, 20180103, D, 3
, которые я могу использовать оконная функция row_number
и разделение по id и элементу для кумулятивного подсчета пары id-item, но это не перезапустит серию счетчиков после появления нового элемента.