Получите среднечасовые значения только по понедельникам за весь год - PullRequest
0 голосов
/ 31 октября 2019

У меня есть набор данных, который выглядит следующим образом: Набор данных

У меня есть большой список заказов с пройденным расстоянием за весь 2018 год. Для прогнозирования заказов дляВ будущем я хочу рассчитать общее количество заказов в час за все понедельники года. Итак, среднее количество заказов между 00:00:00 -: 01: 00: 00 среднее количество заказов с 01:00:00 - 02:00:00 до 23:00:00 - 24:00:00 только по понедельникам,Они не должны включать заказы в другие будние дни.

Пока у меня есть:

df_data = pd.read_csv('Finalorders.csv', parse_dates=['datetime'])

week_dfsum = df_data.groupby(df_data['datetime'].dt.weekday_name).sum()
week_dfsum = df_data.groupby(df_data['datetime'].dt.weekday_name).sum()
pprint(week_dfsum)
pprint(week_dfmean)

Но я не знаю, как включить заказы только в понедельник.

1 Ответ

0 голосов
/ 31 октября 2019

Ты рядом. После того, как вы создадите столбец с именем «День недели», отфильтруйте его по понедельникам:

df[df['Day_of_Week'] == 1]

Это вернет только значения по понедельникам.

...