Я разделил большой фрейм данных на подмножество, нарезав только один столбец Start Time
с помощью `type (object).
test = taxi_2020['Start Time']
Получил столбец
0 00:15:00
1 00:15:00
2 00:15:00
3 00:15:00
4 00:15:00
...
4137289 00:00:00
4137290 00:00:00
4137291 00:00:00
4137292 00:00:00
4137293 00:00:00
Name: Start Time, Length: 4137294, dtype: object
Затем я сгруппировал и суммировал его по подсчету (насколько мне известно)
test.value_counts().sort_index().reset_index()
и получил два столбца
index Start Time
0 00:00:00 24005
1 00:15:00 22815
2 00:30:00 20438
3 00:45:00 19012
4 01:00:00 18082
... ... ...
91 22:45:00 32365
92 23:00:00 31815
93 23:15:00 29582
94 23:30:00 26903
95 23:45:00 24599
Не знаю, почему появился этот index
столбец, теперь мне не удалось его переименовать или преобразовать.
Что я хотел бы увидеть?
Мой идеальный результат - группировать время по часам (24-часовой формат подходит), похоже, что данные подсчитываются каждые 15 минут, поэтому в основном помещаем каждый следующий 4 столбика вместе. 00:15:00
может быть как 0
час, 23:00:00
как 23rd
час.
Мой идеальный результат:
Hour Rides
0 34000
1 60000
2 30000
3 40000
Я хотел бы впоследствии создать простую гистограмму чтобы показать возникновение по часам.
Благодарю за любую помощь!