предположим, что у нас есть следующие dataframe
df = pd.DataFrame({'set_id': [0, 0,1,1,4,4,5,5,6,6],
'data': [-27, -45,-52,-65,-37, 20, 17, -45, -44, 15]})
set_id data
0 0 -27
1 0 -45
2 1 -52
3 1 -65
4 4 -37
5 4 20
6 5 17
7 5 -45
8 6 -44
9 6 15
Я хотел бы выполнить серию различных вычислений между парами последующих наборов, что означает, что мне нужно как-то "извлечь" dataframe
s с помощьюset_id
с из (0,1), (4,5), (5,6), но не (1,4).
пример последующей последовательности dataframe
set_id data
0 0 -27
1 0 -45
2 1 -52
3 1 -65
Я создал дополнительный столбец с sequence_id
, чтобы затем использовать groupby.apply
, однако set_id
5 находится в двух разных последовательностях, поэтому это не решение.
Есть ли решения?предпочтительно пандастик.