Я пытаюсь построить линейный график, сравнивающий показатели убийств отдельных штатов в 1960-1962 гг., Используя Панд в записной книжке Jupyter.
Небольшой контекст о том, где я сейчас нахожусь и как я сюда попал:
Я использую CSV-файл Crime, который выглядит так:
В данный момент меня интересуют только три столбца: Штат, Год и Уровень убийства.В частности, меня интересовали только 5 штатов - Аляска, Мичиган, Миннесота, Мэн, Висконсин.
Итак, чтобы создать нужную таблицу, я сделал это (показывал только 5 лучших записей в строке):
al_mi_mn_me_wi = crimes[(crimes['State'] == 'Alaska') | (crimes['State'] =='Michigan') | (crimes['State'] =='Minnesota') | (crimes['State'] =='Maine') | (crimes['State'] =='Wisconsin')]
control_df = al_mi_mn_me_wi[['State', 'Year', 'Murder Rate']]
Здесь я использовал функцию pivot
df = control_1960_to_1962.pivot(index = 'Year', columns = 'State',values= 'Murder Rate' )
И вот где я застреваю.Я получил KeyError при выполнении (KeyError было Год):
df.plot(x='Year', y='Murder Rate', kind='line')
и при попытке просто
df.plot()
я получаю этот график вонючий.
Как получить желаемый график?