Python: как выбрать строки на основе дельта-времени в pandas кадре данных? - PullRequest
1 голос
/ 24 апреля 2020

У меня есть датафрейм, подобный следующему:

df

          i   j      t_start_date_x        t_end_date_x      t_start_date_y     t_end_date_y
20149   491 191 2020-03-20 12:44:03 2020-03-20 16:03:57 2020-03-20 10:40:47 2020-03-20 17:12:14
20150   504 505 2020-03-20 12:54:14 2020-03-20 16:20:48 2020-03-20 16:39:59 2020-03-20 22:59:14
20151   505 504 2020-03-20 16:39:59 2020-03-20 22:59:14 2020-03-20 12:54:14 2020-03-20 16:20:48
20152   506 282 2020-03-20 10:39:35 2020-03-20 16:31:48 2020-03-20 15:24:32 2020-03-20 15:34:34
20153   515 494 2020-03-20 12:56:40 2020-03-20 18:58:15 2020-03-20 09:55:16 2020-03-20 15:31:22

Я хочу сохранить только те строки, в которых есть перекрытие во времени

          i   j      t_start_date_x        t_end_date_x      t_start_date_y     t_end_date_y
20149   491 191 2020-03-20 12:44:03 2020-03-20 16:03:57 2020-03-20 10:40:47 2020-03-20 17:12:14
20152   506 282 2020-03-20 10:39:35 2020-03-20 16:31:48 2020-03-20 15:24:32 2020-03-20 15:34:34
20153   515 494 2020-03-20 12:56:40 2020-03-20 18:58:15 2020-03-20 09:55:16 2020-03-20 15:31:22

1 Ответ

1 голос
/ 24 апреля 2020

Вы можете сделать это, проверив, находится ли t_start_date_x перед t_end_date_y и что такое же инвертирование x и y, как:

mask_overlap = ((df['t_start_date_x']<=df['t_end_date_y'])
               & (df['t_start_date_y']<=df['t_end_date_x']))
df_overlap = df[mask_overlap]
...