У меня есть этот DataFrame в Python (предположим, что он отсортирован):
Col1 Col2 Col3
a 1 2
a 2 3
a 4 6
b 3 7
b 5 1
, и я хочу добавить новый столбец с именем Col4, где каждое значение является добавлением текущего Col3 и предыдущей строки Col3.
Он должен запустить эту логику, сгруппировав Col1, и если это первая строка в группе, он использует только текущее значение Col3.
Таким образом, оно должно выглядеть следующим образом:
Col1 Col2 Col3 Col4
a 1 2 2 (i.e. 2 - it is the first in first row group)
a 2 3 5 (i.e. 2+3)
a 4 6 9 (i.e. 3+6)
b 3 7 7 (i.e. 7 - it is the first row in second group)
b 5 1 8 (i.e. 7+1)
Как это можно сделать на Python (надеюсь, с использованием groupBy)?
Спасибо