повторная выборка панд перед первой записью набора данных - PullRequest
0 голосов
/ 26 ноября 2018

Уважаемое опытное сообщество, я не могу найти элегантного решения своей проблемы.У меня есть подвыборка моего набора данных, которую я хочу делать еженедельно, но начинаю за несколько недель до первой записи в моем фрейме данных (так, за несколько недель с 0 счетами)

Выборка данных:

In:

print(df_pec.head())

Out:

    Count Image_Sequence_DateTime
18      1     2015-11-06 03:22:19
21      1     2015-11-11 01:48:51
22      1     2015-11-11 07:30:47
37      1     2015-11-25 09:42:23
48      1     2015-12-05 12:12:34

С самой ранней последовательностью изображений в:

In:

df_pec.Image_Sequence_DateTime.min()

Out:

2015-09-30 15:16:38

У меня есть другая функция, которая дает мне начальную точку первой недели и последнюю точку последней недели, когда-либо измеренную в этом эксперименте, а именно:

In:

print(s_startend)

Out:

Start   2015-09-28
End     2017-12-25
dtype: datetime64[ns]

Моя проблема заключается в том, что я хочу повторять выборку df_pec еженедельно, но начиная с самой первой секунды самого первого дня самой первой недели экспериментаразвертывание. (используя s_startend в качестве ссылки)

Я пытаюсь:

df_pec=df_pec.resample('1W', on='Image_Sequence_DateTime').sum() 
print(df_pec.head(),'\n',df_pec.tail())

Out:

                         Count
Image_Sequence_DateTime       
2015-10-04                26.0
2015-10-11                92.0
2015-10-18               204.0
2015-10-25               193.0
2015-11-01               187.0 
                          Count
Image_Sequence_DateTime       
2017-11-19                20.0
2017-11-26                34.0
2017-12-03                16.0
2017-12-10                11.0
2017-12-17                 3.0

Это довольно странно, потому что даже пропускает первые дниданные в df_pec. (начало 2015-09-30 15:16:38)

И даже если это сработало, я не могуДля повторной выборки, чтобы начать и закончить в указанных значениях (s_startend из моего примера), даже если в моей подвыборке нет записей в самые ранние и последние недели. df_pec.

Я думал об искусственном добавлении двух записей в df_pec с помощьюреальное начало и реальный конец, но я думаю, что это не так элегантно, и я не хочу добавлять бессмысленные ключи к моему df.

Большое спасибо за вашу мудрость!

...