У меня есть набор данных simpe в кадре данных, в котором столбец - год, посещаемость, недели.
attendance week years<br>
37440 Sun 2010-04-04
43504 Mon 2010-04-05
38935 Mon 2010-04-05
40052 Mon 2010-04-05
43510 Tue 2010-04-06
38000 Tue 2010-04-06
10090 Tue 2010-04-06
41533 Wed 2010-04-07
Я хотел бы построить разброс, у меня много значений по отношению к каждому днюЯ хотел бы усреднить их и показать их на точечной диаграмме.
Я видел это в другом посте, и я пытался, но он дал ошибку, вот мой код
import pandas as pd
days=['Mon', 'Tue', 'Wed', 'Thur', 'Fri', 'Sat', 'Sun']
log_2010=pd.read_excel('GL2010-2017.xlsx')
year=log_2010['years']
attendance=log_2010['attendace']
week=log_2010['day_of_week']
df=pd.DataFrame({
'years':year,
'attendance':attendance,
'week':week
})
new_df=df.dropna(how='any')
new_df['years']=pd.to_datetime(year,format='%Y%m%d')
df['week'] = pd.Categorical(new_df['week'], categories=days)
df[['week', 'attendance']].groupby('week').mean().plot.scatter(df['week'],df['attendance'])
Я получаю эту ошибку
KeyError: "['Sun''Пн', Пн '...' Солнце '' Солнце '' Солнце '] не в индексе "