У меня есть огромный набор данных, который содержит четыре столбца user_id
, action
, start_time
и end_time
.Я хочу объединить последовательность действий "o"
и start_time
, если бы первые start_time
и end_time
были end_time
последней объединенной записи.
скажем, df
:
"user_id","action","start_time","end_time"
"11","o",23:25:27,23:25:49
"11","o",23:25:28,23:25:28
"11","o",23:25:48,23:26:50
"11","v",23:25:49,23:25:49
"11","v",23:25:49,23:25:50
"11","o",23:28:24,00:22:33
"11","o",00:10:48,00:23:44
"22","o",00:11:52,00:22:33
"22","o",00:22:32,00:27:44
"22","v",00:22:42,00:22:42
"22","o",00:22:42,00:22:42
"22","z",00:22:42,00:22:43
Я хочу объединить число 1, 2 и 3, потому что оба имеют действие "o"
, а слияние имеет start_time
первого ряда и end_time
второго.то же самое применимо к номеру строки 6
и 7
, а также к числовому номеру 8
и 9
.
Итак, желаемый результат:
"user_id","action","start_time","end_time"
"11","o",23:25:27,23:26:50
"11","v",23:25:49,23:25:49
"11","v",23:25:49,23:25:50
"11","o",23:28:24,00:23:44
"22","o",00:11:52,00:27:44
"22","v",00:22:42,00:22:42
"22","o",00:22:42,00:22:42
"22","z",00:22:42,00:22:43
Как я могу сделать это в R?ТНХ