Панды: постройте гистограмму раз с интервалом в 10 минут - PullRequest
0 голосов
/ 05 декабря 2018

У меня есть кадр данных в этом формате:

    DATE        NAME        ARRIVAL TIME
275 2018-07-05  Adam    19:33:51.579885
276 2018-07-05  Bill    19:38:57.578135
277 2018-07-05  Cindy   19:40:24.704381
278 2018-07-05  Don     19:34:29.689414
279 2018-07-05  Eric    19:33:54.173609

Я хотел бы построить гистограмму времени прибытия в фиксированных сегментах, например, каждые 10 минут.

Используя следующий код издругие ответы, мне удалось создать следующую гистограмму:

df['ARRIVAL TIME'] = pd.to_datetime(df['ARRIVAL TIME'])
plt.hist([t.hour + t.minute/60. for t in df['ARRIVAL TIME']], bins = 8)

enter image description here

Это близко к тому, что я хочу.Однако я бы предпочел, чтобы ячейки были "7:30", "7:40" и т. Д.

1 Ответ

0 голосов
/ 05 декабря 2018

Если вы просто хотите изменить метки по умолчанию вручную (см., Например, этот ответ ), должно работать следующее (после выполнения уже выполненных вами команд):

plt.draw()      # do this so that the labels are generated
ax = plt.gca()  # get the figure axes
xticks = ax.get_xticklabels()  # get the current x-tick labels
newlabels = []
for label in xticks:
    h, m = divmod(float(label.get_text())%12, 1)  # get hours and minutes (in 12 hour clock)
    newlabels.append('{0:02d}:{1:02d}'.format(int(h), int(m*60)))  # create the new label

ax.set_xticklabels(newlabels)  # set the new labels

Но если вы хотите, чтобы ребра гистограмм были специально настроены на интервалы в 10 минут, вы можете сделать следующее:

import numpy as np

# get a list of the times
times = [t.hour + t.minute/60. for t in df['ARRIVAL TIME']]

# set the time interval required (in minutes)
tinterval = 10.

# find the lower and upper bin edges (on an integer number of 10 mins past the hour)
lowbin = np.min(times) - np.fmod(np.min(times)-np.floor(np.min(times)), tinterval/60.)
highbin = np.max(times) - np.fmod(np.max(times)-np.ceil(np.max(times)), tinterval/60.)
bins = np.arange(lowbin, highbin, tinterval/60.)  # set the bin edges

# create the histogram
plt.hist(times, bins=bins)
ax = plt.gca()  # get the current plot axes
ax.set_xticks(bins)  # set the position of the ticks to the histogram bin edges

# create new labels in hh:mm format (in twelve hour clock)
newlabels = []
for edge in bins:
    h, m = divmod(edge%12, 1)  # get hours and minutes (in 12 hour clock)
    newlabels.append('{0:01d}:{1:02d}'.format(int(h), int(m*60)))  # create the new label

ax.set_xticklabels(newlabels)  # set the new labels
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...