Скажем, у меня есть фрейм данных, например:
df = pd.DataFrame({'A': [1, 1, 2, 3, 3, 3, 1, 1]})
Я хотел бы подсчитать, сколько раз текущее значение столбца было видно в предыдущей строке. Для приведенного выше примера вывод будет:
[1, 2, 1, 1, 2, 3, 1, 2]
Я знаю, как сгруппировать и суммировать все повторяющиеся значения, но я не знаю, как заставить его перезапускаться при каждом новом значении.
т.е.
df['A'].groupby(df['A']).cumcount()
# returns [0, 1, 0, 0, 1, 2, 2, 3] which is not what I want.