У меня есть следующий пример набора данных:
groupby prevoius current
A 1 1
A 0 1
A 0 0
A 1 0
A 1 1
A 0 1
Я хочу создать следующую таблицу, суммируя «предыдущий» и «текущий» столбцы.
previous_total current_total
3 4
Я перепробовал все комбинации groupby с .agg и попытался достичь приведенной выше таблицы, но не смог заставить что-либо успешно работать.
Я также знаю, как это сделать в Python Pandas, но не в Pyspark.