Рассчитать идентификатор сессии из разницы временных отметок панд - PullRequest
0 голосов
/ 11 января 2019

Мои данные выглядят как ниже. Я рассчитал разницу во времени между строками в timeDiff.

sale       datetime                timeDiff  
apple      2018-08-25 15:40:00     00:05:00   
oranges    2018-08-25 15:35:00     00:11:00    
mushrooms  2018-08-25 15:24:00     00:12:00   
mango      2018-08-25 15:12:00     01:35:00   
apple      2018-08-25 13:37:00     00:10:00   
apple      2018-08-25 13:27:00     00:15:00 

Я пытаюсь создать идентификаторы сеансов для своего набора данных временных рядов. Если разница во времени (между строками) превышает 90 минут (01:30:00), я хотел бы создать новый идентификатор сеанса. Я нашел несколько похожих решений, но не для панд, и не уверен, с чего начать.

панды-0.23.4

if data['timeDiff'] >= '01:30:00' :
    data['session']= ID+1

sale       datetime                timeDiff  Session_ID
apple      2018-08-25 15:40:00     00:05:00   1
oranges    2018-08-25 15:35:00     00:11:00   1 
mushrooms  2018-08-25 15:24:00     00:12:00   1
mango      2018-08-25 15:12:00     01:35:00   1
apple      2018-08-25 13:37:00     00:10:00   2
apple      2018-08-25 13:27:00     00:15:00   2
...