Я пытаюсь найти среднее время в пути для среднего рабочего дня = 5 дней и среднего выходного дня = 2 дня. '
Я пытаюсь агрегировать и найти среднее значение для всех строк с одинаковыми «Time» и «Day_type». Поскольку значения «Время» также включают секунды, я нахожу некоторые проблемы с сопоставлением всех значений времени, которые принадлежат одному и тому же «Времени».
Мой фрейм данных настроен следующим образом:
veh-time distance Date Time Day_of_week Day_type
0 72 379.0 2018-10-18 22:15:21 Thursday Weekday
1 72 379.0 2018-10-18 22:30:21 Friday Weekend
2 72 379.0 2018-10-18 22:45:22 Saturday Weekend
3 72 379.0 2018-10-18 23:00:20 Sunday Weekday
4 72 379.0 2018-10-18 23:15:21 Monday Weekday
5 72 379.0 2018-10-18 23:15:21 Tuesday Weekday
6 72 379.0 2018-10-18 23:15:21 Wednesday Weekday
7 72 379.0 2018-10-18 22:15:21 Thursday Weekday
8 72 379.0 2018-10-18 22:30:21 Friday Weekend
9 72 379.0 2018-10-18 22:45:22 Saturday Weekend
10 72 379.0 2018-10-18 23:00:20 Sunday Weekday
11 72 379.0 2018-10-18 23:15:21 Monday Weekday
12 72 379.0 2018-10-18 23:15:21 Tuesday Weekday
13 72 379.0 2018-10-18 23:15:21 Wednesday Weekday
Я предполагаю, что процесс будет выглядеть так:
ШАГ 1:
разделите столбец «Время», чтобы он только показывал ЧЧ: ММ. Возможно, используйте regex
или str.split()
ШАГ 2:
сгруппировать все строки времени, которые соответствуют 'Time' И 'Day_type' - например, все строки со временем 22:15 и типом дня Weekday
ШАГ 3:
добавьте новый столбец: 'avg_vt' после нахождения среднего значения для сгруппированных строк на шаге 2.
avg_vt = veh-time + veh-time и т. д. / число идентифицированных экземпляров Day_type
Спасибо,
R