Time out - время в, с мульти_индексом df - PullRequest
0 голосов
/ 26 марта 2019

У меня есть фрейм данных с некоторыми данными о людях, въезжающих и покидающих какую-то область, и я хочу вычислить, какова разница между меткой времени ухода и меткой времени входа.

Это одна группа, и я хочу заполнить столбец формулы. В столбце in_out 0 обозначает выход, а 1 - ввод.

subject_code    in_out  timestamp           sensor_id   sensor_name zone_code   zone_name               zone_m2 idx     union   formula time
Ident1          0       2019-02-04 15:00:00 cam08       cam08 MI Ctr Pol OUT    MI_CTR_POL  MI          32      51103   50498   NaN     2019-02-04 15:00:08
                        2019-02-04 18:31:00 cam08       cam08 MI Ctr Pol OUT    MI_CTR_POL  MI          32      52844   50753   NaN     2019-02-04 18:31:58
                        2019-02-04 20:43:00 cam08       cam08 MI Ctr Pol OUT    MI_CTR_POL  MI          32      53417   50826   NaN     2019-02-04 20:43:39
                        2019-02-05 01:29:00 cam08       cam08 MI Ctr Pol OUT    MI_CTR_POL  MI          32      56223   51087   NaN     2019-02-05 01:29:35
                1       2019-02-04 13:47:00 cam07       cam07 MI Ctr Pol IN     MI_CTR_POL  MIc         32      50498   51103   NaN     2019-02-04 13:47:33
                        2019-02-04 13:58:00 cam07       cam07 MI Ctr Pol IN     MI_CTR_POL  MIc         32      50753   52844   NaN     2019-02-04 13:58:45
                        2019-02-04 14:34:00 cam07       cam07 MI Ctr Pol IN     MI_CTR_POL  MIc         32      50826   53417   NaN     2019-02-04 14:34:26
                        2019-02-04 14:52:00 cam07       cam07 MI Ctr Pol IN     MI_CTR_POL  MIc         32      51087   56223   NaN     2019-02-04 14:52:25

Так, например, для первого случая будет

формула = 2019-02-04 15:00:00 - 2019-02-04 13: 47: 00

РЕДАКТИРОВАТЬ: я создал эти группы с df.groupby(['subject_code', 'in_out', pd.Grouper(key='timestamp', freq='60s')]).first()

...