Как мне остановить pandas dataframe.resample ('T') от автоматического добавления дополнительных индексов в dataframe? - PullRequest
0 голосов
/ 04 апреля 2019

Я пытаюсь уменьшить частоту данных, содержащую данные за минутой, в 5-минутные ячейки.Вот мой текущий код:

df = pd.read_csv('stockPrices/closingPrices-apr3.csv',index_col='date',parse_dates=True)
df['close'] = df['close'].shift()
df5min = df.resample('5T').last()
print(df5min.tail())

Ссылка на CSV-файл находится здесь: https://drive.google.com/file/d/1uvkUaJwrQNsmte5IQIsJ_g5GS8RjVd8B/view?usp=sharing

Вывод должен быть остановлен в 2019-04-03 14:40:00, потому чтопоследнее значение 14:48:00, а 5-минутный интервал с 14: 45-14: 49 невозможен.Однако я получаю следующие значения индекса даты и времени, которых нет в моем файле csv:

2019-04-03 14:45:00  286.35
2019-04-03 14:50:00  286.52
2019-04-03 14:55:00  286.32
2019-04-03 15:00:00  286.45
2019-04-03 15:05:00  280.64

Единственное исправление, которое я могу найти до сих пор, - это использование следующего кода, но затем все мои данные из предыдущегов 14:40 отключаются дни:

df5min = df.resample('5T').last().between_time(start_time='9:30',end_time='14:40')

Любая помощь в этом приветствуется.

1 Ответ

0 голосов
/ 04 апреля 2019

решение выдаст строку, которую вы, вероятно, не захотите за 03.04.2008 15: 05

df = pd.read_csv('./closingPrices-apr3.csv', index_col='date',parse_dates=True)
df.sort_index(inplace = True)
df = df.shift(5)
df_5min = df.resample('5T').first()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...