Представьте себе фрагмент следующего фрейма данных:
ID ActivityName Time Type Shape
1 1 Request 0.000 Type_1 767
2 1 Request 600.000 Type_1 767
3 1 Start 600.000 Type_1 1376
4 1 Start 600.000 Type_1 1376
5 1 Delay 2962.295 Type_1 1022
6 1 Schedule Activities 600.000 Type_1 15
7 1 Schedule Activities 2062.295 Type_1 15
Я пытаюсь создать два новых столбца на основе повторяющихся записей в ActivityName .
В частности, я хочу объединить две последующие строки для одного и того же действия в одну строку с начальной и полной отметкой времени (от времени в секундах).
Учитывая, что не все записи в ActivityName имеют совпадающую вторую запись (однако, максимум две последовательные записи идентичны), я также хотел бы удалить такие строки, как Delay в данном случае.
Затем он должен выглядеть примерно так:
ID ActivityName StartTime EndTime Type Shape
1 1 Request 0.000 600.000 Type_1 767
2 1 Start 600.000 600.000 Type_1 1375
3 1 Schedule Activities 600.000 2062.295 Type_1 15
Все категории в ActivityName встречаются много раз в этом столбце. Я надеюсь не сравнивать их Время не по всей колонке, а только тех, у кого есть два идентичных события подряд.
Любые идеи о том, как go об этом, будут высоко оценены.