Итак, еще раз, у меня есть еще один вопрос, связанный с этим: я обрабатываю DataFrame, который выглядит следующим образом:

вещьв том, что теперь я хочу добавить дополнительный столбец с именем 'position', в котором, согласно contributor_id и количеству правок, появляется номер соответствующей строки.Дело в том, что теперь я не хочу, чтобы количество строк перезапускалось до тех пор, пока значение в nEdits не станет больше 0, и это число должно быть повторно установлено на 1 при изменении contributor_id:
contributor_id timestamp nEdits Position
0 8 2018-01-01 1 1
1 8 2018-02-01 1 2
2 8 2018-03-01 1 3
3 8 2018-04-01 1 4
4 8 2018-05-01 1 5
5 8 2018-06-01 1 6
6 8 2018-07-01 1 7
7 8 2018-08-01 1 8
8 26424341 2018-01-01 0 0
9 26424341 2018-02-01 0 0
10 26424341 2018-03-01 11 1
11 26424341 2018-04-01 34 2
12 26424341 2018-05-01 42 3
13 26424341 2018-06-01 46 4
14 26424341 2018-07-01 50 5
15 26424341 2018-08-01 54 6
16 26870381 2018-01-01 465 1
17 26870381 2018-02-01 566 2
18 26870381 2018-03-01 601 3
Идея, которую я получил из некоторых ответов для вычисления столбца position
, заключается в следующем: df.groupby("contributor_id").position.cumsum()
Но я не знаю, как включить условие, что nEdits должно быть больше 0, чтобы перезапустить счет.