Вот пример моего набора данных с некоторых видов общественного транспорта:
набор данных .
Дата с 2018-06-01 по 2018-06-30,
Время - часы работы, с 5 до 24 (0) утра,
Люди - это количество людей в определенную дату, время и поездку.
from_to - это место, куда эти люди входят и выходят (один тип поездок),
и, наконец, день недели.
Что мне нужно сделать здесь, так это создать расписание для каждой поездки, например, если я хочу создать таблицу для поездки "G1_G2", код, который я сейчас использую:
for i in [0,1,2,3,4,5,6]:
for j in [0,1,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23]:
df['people'][(df['weekday'] == i)&(df['from_to'] == 'G1_G2') & (df['time'] == j)].mean()
Где "i" - день недели, а j - часы работы.
Результатом будет таблица типа:
таблица вывода
Но проблема здесь в том, что на создание каждой таблицы уходит около 10 секунд, здесь есть около 11 000 типов поездок, которые займут 30 с лишним часов.
Есть ли другие способы сделать это с большей эффективностью, используя python?
Спасибо заранее!