Мои данные выглядят как ниже. Я рассчитал разницу во времени между строками в timeDiff.
sale datetime timeDiff
apple 2018-08-25 15:40:00 00:05:00
oranges 2018-08-25 15:35:00 00:11:00
mushrooms 2018-08-25 15:24:00 00:12:00
mango 2018-08-25 15:12:00 01:35:00
apple 2018-08-25 13:37:00 00:10:00
apple 2018-08-25 13:27:00 00:15:00
Я пытаюсь создать идентификаторы сеансов для своего набора данных временных рядов. Если разница во времени (между строками) превышает 90 минут (01:30:00), я хотел бы создать новый идентификатор сеанса. Я нашел несколько похожих решений, но не для панд, и не уверен, с чего начать.
панды-0.23.4
if data['timeDiff'] >= '01:30:00' :
data['session']= ID+1
sale datetime timeDiff Session_ID
apple 2018-08-25 15:40:00 00:05:00 1
oranges 2018-08-25 15:35:00 00:11:00 1
mushrooms 2018-08-25 15:24:00 00:12:00 1
mango 2018-08-25 15:12:00 01:35:00 1
apple 2018-08-25 13:37:00 00:10:00 2
apple 2018-08-25 13:27:00 00:15:00 2