построение точечного графика по неделям дней в питоне - PullRequest
0 голосов
/ 20 мая 2018

У меня есть набор данных simpe в кадре данных, в котором столбец - год, посещаемость, недели.

attendance    week      years<br>
37440         Sun       2010-04-04
43504         Mon       2010-04-05
38935         Mon       2010-04-05
40052         Mon       2010-04-05
43510         Tue       2010-04-06
38000         Tue       2010-04-06
10090         Tue       2010-04-06
41533         Wed       2010-04-07 

Я хотел бы построить разброс, у меня много значений по отношению к каждому днюЯ хотел бы усреднить их и показать их на точечной диаграмме.
Я видел это в другом посте, и я пытался, но он дал ошибку, вот мой код

import pandas as pd

days=['Mon', 'Tue', 'Wed', 'Thur', 'Fri', 'Sat', 'Sun']
log_2010=pd.read_excel('GL2010-2017.xlsx')

year=log_2010['years']
attendance=log_2010['attendace']
week=log_2010['day_of_week']
df=pd.DataFrame({
    'years':year,
       'attendance':attendance,
       'week':week
    })
new_df=df.dropna(how='any')
new_df['years']=pd.to_datetime(year,format='%Y%m%d')
df['week'] = pd.Categorical(new_df['week'], categories=days)


df[['week', 'attendance']].groupby('week').mean().plot.scatter(df['week'],df['attendance'])

Я получаю эту ошибку
KeyError: "['Sun''Пн', Пн '...' Солнце '' Солнце '' Солнце '] не в индексе "

1 Ответ

0 голосов
/ 20 мая 2018

Попробуйте настроить неделю в качестве индекса при импорте данных из файла Excel: log_2010 = pd.read_excel ('GL2010-2017.xlsx', index_col = 'week')

...