У меня есть кадр данных dask с npartition = 8, вот снимок данных:
id1 id2 Page_nbr record_type
St1 Sc1 3 START
Sc1 St1 5 ADD
Sc1 St1 9 OTHER
Sc2 St2 34 START
Sc2 St2 45 DURATION
Sc2 St2 65 END
Sc3 Sc3 4 START
Я хочу добавить столбец после record_type и добавить уникальный group_id на основе условия типа записитак что до следующего record_type = START добавьте тот же уникальный group_id, вывод будет выглядеть следующим образом:
id1 id2 Page_nbr record_type group_id
St1 Sc1 3 START 1
Sc1 St1 5 ADD 1
Sc1 St1 9 OTHER 1
Sc2 St2 34 START 2
Sc2 St2 45 DURATION 2
Sc2 St2 65 END 2
Sc3 Sc3 4 START 3
group_id может быть любым уникальным числом.Поскольку размер данных очень велик, итерации по строкам могут быть не лучшим вариантом.Хотите знать, есть ли какой-нибудь питонический способ сделать это?