У меня есть большой массив данных о ценах на акции:
stock_data.head()
date open high low close volume Name
0 2013-02-08 15.07 15.12 14.63 14.75 8407500 AAL
1 2013-02-11 14.89 15.01 14.26 14.46 8882000 AAL
2 2013-02-12 14.45 14.51 14.10 14.27 8126000 AAL
3 2013-02-13 14.30 14.94 14.25 14.66 10259500 AAL
4 2013-02-14 14.94 14.96 13.16 13.99 31879900 AAL
Если бы я хотел выбрать доли яблок, например, из этого большого набора данных, я бы сделал:
aapl = stock_data.loc[stock_data['Name']=='AAPL']
, который обеспечивает :
aapl.head()
date open high low close volume Name
1259 2013-02-08 67.7142 68.4014 66.8928 67.8542 158168416 AAPL
1260 2013-02-11 68.0714 69.2771 67.6071 68.5614 129029425 AAPL
1261 2013-02-12 68.5014 68.9114 66.8205 66.8428 151829363 AAPL
1262 2013-02-13 66.7442 67.6628 66.1742 66.7156 118721995 AAPL
1263 2013-02-14 66.3599 67.3771 66.2885 66.6556 88809154 AAPL
Я пытался назвать это новым df
, чтобы сделать столбец date
индексом для последующего вызова plt.plot()
, но, похоже, это не сработало.
Как я могу построить два столбца друг против друга, учитывая эти выбранные строки? Например, для построения графика столбца date
относительно столбца open
, указанного stock_data['Name'] == AAPL
?
И для дальнейшей фильтрации, как я могу изменить значения, чтобы они были чем-то вроде средних значений open
по неделям / месяц / год и т. д. c?