У меня есть датафрейм, в котором есть пользователи, действия и время, когда пользователи выполняли действия. Я хочу сгруппировать действия в список, если они удовлетворяют ОБА из двух условий:
1. действия были предприняты одним и тем же пользователем
2. действия были предприняты в течение 20 минут.
В данный момент я пытаюсь использовать timedelta для вычисления разницы во времени с итерацией и читаю этот пост, но это не то, что я ищу. Я изо всех сил пытаюсь найти подобные примеры.
датафрейм имеет тысячи строк, это его часть
user action time
A browse 2018-07-01 06:00:00
A edit 2018-07-01 06:10:00
B signin 2018-07-01 06:00:00
B browse 2018-07-01 06:11:00
B edit 2018-07-01 07:00:00
Ожидаемым результатом будет список действий, удовлетворяющих условиям
output
[[browse, edit], [signin, browse]]
Последнее «редактирование», выполненное пользователем B, отсутствует в нем, потому что (07:00:00) - (06:11:00)> 20 минут
Любые предложения о том, как я могу это сделать? Большое спасибо в продвинутом!