У меня есть следующие фреймы данных:
import pandas as pd
import numpy as np
df_Sensor = pd.DataFrame({'ID_System_Embed': ['1000', '1000', '1000', '1003', '1004'],
'Date_Time': ['2020-10-18 12:58:05', '2020-10-18 12:58:15',
'2020-10-19 20:10:10', '2018-12-18 12:58:00',
'2015-10-25 11:00:00']})
df_Period = pd.DataFrame({'ID_System_Embed': ['1000', '1000', '1001', '1002', '1003', '1004'],
'ID_Sensor': ['1', '2', '3', '4', '5', '6'],
'Date_Init': ['2020-10-18 12:58:00', '2020-10-18 19:58:00',
'2019-11-18 19:58:00', '2018-12-29 12:58:00',
'2019-11-20 12:58:00', '2015-10-25 10:00:00'],
'Date_End': ['2020-10-18 16:58:00', '2020-10-19 20:58:00',
'2019-11-25 12:58:00', '2018-12-18 12:58:00',
'2019-11-25 12:58:00', '2015-10-25 12:00:00']})
Мне нужно определить, содержится ли дата в фрейме данных df_Sensor в диапазоне дат второго фрейма данных (df_Period) для того же ID_System_Embed (Identifier) встроенной системы).
Я попытался реализовать следующий код:
df_Period['New_Column'] = 0
for j in range(0, len(df_Period)):
for i in range(0, len(df_Sensor)):
if((df_Sensor['ID_System_Embed'].iloc[i] == df_Period['ID_System_Embed'].iloc[j]) &
(df_Sensor['Date_Time'].iloc[i] >= df_Period['Date_Init'].iloc[j]) &
(df_Sensor['Date_Time'].iloc[i] <= df_Period['Date_End'].iloc[j])):
df_Period['New_Column'].iloc[j] += 1
Этот код объединяется и приводит к ожидаемому результату. Тем не менее, это не очень эффективно, потому что нужно перебирать два фрейма данных (используя for). Я хотел бы найти более быстрый и эффективный способ выполнить операцию и получить такой же вывод.
Вывод:
ID_System_Embed ID_Sensor Date_Init Date_End New_Column
1000 1 2020-10-18 12:58:00 2020-10-18 16:58:00 2
1000 2 2020-10-18 19:58:00 2020-10-19 20:58:00 1
1001 3 2019-11-18 19:58:00 2019-11-25 12:58:00 0
1002 4 2018-12-29 12:58:00 2018-12-18 12:58:00 0
1003 5 2019-11-20 12:58:00 2019-11-25 12:58:00 0
1004 6 2015-10-25 10:00:00 2015-10-25 12:00:00 1