Мне нужно отдельно проанализировать записи между отверстиями, содержащимися в регулярно разнесенных временных рядах.
Например, в следующем временном ряду, регулярно разносимом каждые 6 секунд, существует промежуток между 00:24 и 00:54:
2018-01-01 00:00:00 4.2
2018-01-01 00:00:06 4.1
2018-01-01 00:00:12 4.3
2018-01-01 00:00:18 3.4
2018-01-01 00:00:24 4.7
2018-01-01 00:00:54 3.3
2018-01-01 00:01:00 8.2
Мне нужно отдельно проанализировать две следующие группы:
Первая группа:
2018-01-01 00:00:00 4.2
2018-01-01 00:00:06 4.1
2018-01-01 00:00:12 4.3
2018-01-01 00:00:18 3.4
2018-01-01 00:00:24 4.7
Вторая группа:
2018-01-01 00:00:54 3.3
2018-01-01 00:01:00 8.2
Многочисленные дыры содержатся в огромном наборе данных, и анализ требует сравнения последовательных групп.
Здесь следует некоторый код для воспроизведения примера:
data_index = pd.DatetimeIndex(['2018-01-01 00:00:00', '2018-01-01 00:00:
06','2018-01-01 00:00:12','2018-01-01 00:00:18', '2018-01-01 00:00:24', '2018-01-01 00:00:54', '2018-01-01 00:01:00'])
data = [4.2, 4.1,4.3,3.4, 4.7, 3.3, 8.2]
df = pd.DataFrame(data_index, columns=['date'])
df['datetime'] = pd.to_datetime(df['date'])
df = df.set_index('datetime')
df.drop(['date'], axis=1, inplace=True)
df['data'] = data