PySpark - последовательная группа by and sum - PullRequest
0 голосов
/ 02 марта 2020

Я хотел бы сделать последовательную группировку сумм по заданным c группам, например,

Group     -     Week     -     Value
A                1               10
A                2               10
A                3                5
A                4               20
A                5               10
B                1               30
B                2                5
B                3               10
B                4               10
B                5                5
C                1               20
C                2               30
C                3               40
C                4               10
C                5                5

По сути, мой вывод будет последовательной суммой первых 3 недель для каждой группы. Например,

Group A - Sum from week 1 to 3: 10+10+5 = 25
Group A - Sum from week 2 to 4: 10+5+20 = 35
Group A - Sum from week 3 to 5:  5+20+10 = 35
Group B - Sum from week 1 to 3: ....
...
Group C - Sum from week 3 to 5: ....

Кто-нибудь может мне помочь в этом? Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...