Предположим, у меня есть следующий фрейм данных:
df = pd.DataFrame({"user":[11,11,11,21,21,21,21,21,32,32],
"event":[0,0,1,0,0,1,1,1,0,0],
"datetime":['05:29:54','05:32:04','05:32:08',
'15:35:26','15:36:07','15:36:16','15:36:50','15:36:54',
'09:29:12', '09:29:25'] })
Я хотел бы обработать повторяющиеся строки в первом столбце (пользователь), чтобы получить следующее.
В этом случае мы заменяем столбец 'event' на максимальное значение, связанное с столбцом 'user' (например, для user = 11, максимальное значение для события равно 1). А третий столбец заменяется средним значением даты и времени.
P.S. Уже говорилось о том, чтобы отбрасывать повторяющиеся строки здесь , однако я не хочу отбрасывать строки вслепую. Особенно, когда я имею дело с фреймом данных с большим количеством атрибутов.