У меня есть набор данных для поездки в такси за четыре года (2010-2013). Я хочу провести некоторый предварительный анализ данных, просматривая графики каждого значения в столбцах буксировки во фрейме данных, например (xlabel ('Day Hours')). Я хочу, чтобы оно было между (1-24) или (0-23) & (ylabel(«Продолжительность поездки (секунды)»), но средняя проблема в столбце (pickup_hour) не является последовательной, она основана на столбце datetime.
>>df10.head(20)
Первые 20 строк Затем,Я пытался построить данные следующим образом:
fig, ax = plt.subplots(figsize=(9, 7))
plt.plot(df10['pickup_hour'][0:10],df10[' trip_time_in_secs'][0:10])
plt.xlabel('Day Hours')
plt.ylabel('Trip Duration (seconds)')
#plt.xticks(rotation='vertical')
plt.show()
График для первых 10 строк
Теперь я надеюсь найти способ помочь, пожалуйста, спасибо заранее.