Я пытаюсь уменьшить частоту данных, содержащую данные за минутой, в 5-минутные ячейки.Вот мой текущий код:
df = pd.read_csv('stockPrices/closingPrices-apr3.csv',index_col='date',parse_dates=True)
df['close'] = df['close'].shift()
df5min = df.resample('5T').last()
print(df5min.tail())
Ссылка на CSV-файл находится здесь: https://drive.google.com/file/d/1uvkUaJwrQNsmte5IQIsJ_g5GS8RjVd8B/view?usp=sharing
Вывод должен быть остановлен в 2019-04-03 14:40:00, потому чтопоследнее значение 14:48:00, а 5-минутный интервал с 14: 45-14: 49 невозможен.Однако я получаю следующие значения индекса даты и времени, которых нет в моем файле csv:
2019-04-03 14:45:00 286.35
2019-04-03 14:50:00 286.52
2019-04-03 14:55:00 286.32
2019-04-03 15:00:00 286.45
2019-04-03 15:05:00 280.64
Единственное исправление, которое я могу найти до сих пор, - это использование следующего кода, но затем все мои данные из предыдущегов 14:40 отключаются дни:
df5min = df.resample('5T').last().between_time(start_time='9:30',end_time='14:40')
Любая помощь в этом приветствуется.