Уважаемое опытное сообщество, я не могу найти элегантного решения своей проблемы.У меня есть подвыборка моего набора данных, которую я хочу делать еженедельно, но начинаю за несколько недель до первой записи в моем фрейме данных (так, за несколько недель с 0 счетами)
Выборка данных:
In:
print(df_pec.head())
Out:
Count Image_Sequence_DateTime
18 1 2015-11-06 03:22:19
21 1 2015-11-11 01:48:51
22 1 2015-11-11 07:30:47
37 1 2015-11-25 09:42:23
48 1 2015-12-05 12:12:34
С самой ранней последовательностью изображений в:
In:
df_pec.Image_Sequence_DateTime.min()
Out:
2015-09-30 15:16:38
У меня есть другая функция, которая дает мне начальную точку первой недели и последнюю точку последней недели, когда-либо измеренную в этом эксперименте, а именно:
In:
print(s_startend)
Out:
Start 2015-09-28
End 2017-12-25
dtype: datetime64[ns]
Моя проблема заключается в том, что я хочу повторять выборку df_pec еженедельно, но начиная с самой первой секунды самого первого дня самой первой недели экспериментаразвертывание. (используя s_startend в качестве ссылки)
Я пытаюсь:
df_pec=df_pec.resample('1W', on='Image_Sequence_DateTime').sum()
print(df_pec.head(),'\n',df_pec.tail())
Out:
Count
Image_Sequence_DateTime
2015-10-04 26.0
2015-10-11 92.0
2015-10-18 204.0
2015-10-25 193.0
2015-11-01 187.0
Count
Image_Sequence_DateTime
2017-11-19 20.0
2017-11-26 34.0
2017-12-03 16.0
2017-12-10 11.0
2017-12-17 3.0
Это довольно странно, потому что даже пропускает первые дниданные в df_pec. (начало 2015-09-30 15:16:38)
И даже если это сработало, я не могуДля повторной выборки, чтобы начать и закончить в указанных значениях (s_startend из моего примера), даже если в моей подвыборке нет записей в самые ранние и последние недели. df_pec.
Я думал об искусственном добавлении двух записей в df_pec с помощьюреальное начало и реальный конец, но я думаю, что это не так элегантно, и я не хочу добавлять бессмысленные ключи к моему df.
Большое спасибо за вашу мудрость!