У меня есть файл .txt с тремя столбцами: время, тикер, цена. Время с интервалом в 15 секунд. Похоже, это загружено в блокнот jupyter и помещено в Pandas DF.
time ticker price
0 09:30:35 EV 33.860
1 00:00:00 AMG 60.430
2 09:30:35 AMG 60.750
3 00:00:00 BLK 455.350
4 09:30:35 BLK 451.514
... ... ... ...
502596 13:00:55 TLT 166.450
502597 13:00:55 VXX 47.150
502598 13:00:55 TSLA 529.800
502599 13:00:55 BIDU 103.500
502600 13:00:55 ON 12.700
# NOTE: the first set of data has the data at market open for -
# every other time point, so that's what the 00:00:00 is.
#It is only limited to the 09:30:35 data.
Мне нужно создать функцию, которая принимает входной сигнал (тикер), а затем создает гистограмму, которая отображает данные с 5-минутными тиками (данные каждые 20 секунд, поэтому для каждых 15 моментов времени).
До сих пор я думал о том, чтобы отделить часть "мм" от чч: мм: сс, чтобы просто получить минуты в другом столбце, а затем задать значение a для l oop, которое выглядит примерно так:
for num in df['mm']:
if num %5 == 0:
print('tick')
затем каким-то образом добавьте «галочку» в столбец «время» для каждых 5 минут данных (я не уверен, как бы я это сделал), затем используйте столбец времени в качестве индекса и только использование данных с индексом "галочка" в нем (своего рода оператор if). Я не уверен, имеет ли это смысл, но я не обращаю на это внимания. Я довольно новичок в python, поэтому, пожалуйста, держитесь за меня.
Если бы кто-нибудь мог дать какое-то понимание, я был бы очень признателен.