Допустим, у меня есть такой набор данных с меткой времени и идентификатором пользователя.
Я хочу создать переменную «сессии» таким образом, чтобы я мог указать время (1 мин или 2 мин) и для каждого идентификатора пользователя, если следующий раз в пределах идентификатора пользователя будет в течение этого времени (1 или 2 мин или итак) тогда оба записываются как один и тот же сеанс. В основном я смотрю в первый раз, а затем рассчитываю разницу в следующий раз, и если в течение 1 минуты, то же сеанс. Аналогично, если сеанс меняется, мы берем это новое время сеанса за базовое время и рассчитываем все последующие посещения с учетом этого нового времени сеанса.
Я хочу, чтобы этот таймфрейм был похож на переменную, с которой можно играть, а не жестко закодировать.
Я могу сделать это в SQL с помощью оконной функции. было интересно, как это сделать в пандах.
time company_id
2018-10-23 00:01:23 113141P
2018-10-23 00:01:29 113141P
2018-10-23 00:07:37 113141P
2018-10-23 00:22:23 113141P
2018-10-23 00:23:10 113141P