Я считаю, что самый простой способ сделать это - использовать pandas.DatetimeIndex
, чтобы извлечь день недели из datetimes
и использовать его вместе с массивом интересующих вас опций (т. Е. `['car', 'truck']), чтобы накапливать вхождение для каждого часа в течение каждого дня в диапазоне дат.Вот пример, который демонстрирует этот подход (используя некоторые случайно сгенерированные данные для демонстрации)
week = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday', 'Saturday', 'Sunday']
opts = [['car', 'truck'],
['blue', 'yellow', 'red'],
['other', 'other2', 'other3']]
dates = pd.date_range('01-01-2000', '01-01-2001', freq='H')
cOne = list()
cTwo = list()
cThree = list()
n = len(dates)
for ii in range(n):
cOne.append(opts[0][np.random.randint(0,2)])
cTwo.append(opts[1][np.random.randint(0,3)])
cThree.append(opts[2][np.random.randint(0,3)])
df = pd.DataFrame({'cOne': cOne,
'cTwo': cTwo,
'cThree': cThree,
'Date': dates})
df = df.set_index(pd.DatetimeIndex(pd.to_datetime(df['Date'])))
hours = df.index.hour
columnsTitles=["Date", "cOne", "cTwo", "cThree"]
df=df.reindex(columns=columnsTitles)
x = pd.date_range('00:00', '23:00', freq = 'H')
x = range(0,24,1)
rows = len(df.index)
col = df.columns
fig = plt.figure(figsize=(21,3*(len(col)-1)))
fig.suptitle("Hourly Occurence by Day of Week", y = 1)
for mm in range(1, len(col)):
for ii in range(len(week)):
y = [[0]*len(x) for i in range(len(opts[mm-1]))]
for jj in range(rows):
if dates[jj].dayofweek == ii:
for kk in range(len(opts[mm-1])):
if df[col[mm]][jj] == opts[mm-1][kk]:
y[kk][hours[jj]] = y[kk][hours[jj]] + 1
break
ax = fig.add_subplot(len(col)-1, len(week), ii + (mm - 1)*(len(week)) + 1)
if mm == 1:
ax.set_title(week[ii])
for ll in range(len(opts[mm-1])):
ax.plot(x, y[ll], linewidth=1, linestyle='-', alpha=0.7)
plt.show()
Выходные данные которого 