Группировка временных рядов по почасовому счету в питон-пандах - PullRequest
0 голосов
/ 27 мая 2019
df['data'] = df['data'].dropna()
df['data'] = df['data'].str.strip("'(), ")
df['data'] = pd.to_datetime(df['data'], format='%Y-%m-%d %H:%M:%S.%f')
df['data'] = df['data'].dropna()

Это мой заголовок набора данных

0   2019-05-26 00:00:00.326000+00:00
1   2019-05-26 00:00:00.690000+00:00
2   2019-05-26 00:00:02.850000+00:00
3   2019-05-26 00:00:02.971000+00:00
4   2019-05-26 00:00:03.432000+00:00
Name: data, dtype: datetime64[ns, UTC]

Мне нужно посчитать почасово. требуемый вывод


интервал времени: Всего

0 - 1: 5 раз 1 - 2: 10 раз .. .. 23 - 24: 4 раза


DF [данных] .Head ()

1 Ответ

1 голос
/ 27 мая 2019

Использовать pandas.Series.dt.hour.

Задано df:

                     data
0 2019-05-26 01:00:00.326
1 2019-05-26 02:00:00.690
2 2019-05-26 02:00:02.850
3 2019-05-26 03:00:02.971
4 2019-05-26 05:00:03.432

Использование df['data'].dt.hour с pd.DataFrame.groupby.count:

import pandas as pd

df.groupby(df['data'].dt.hour).count()

Выход:

      data
data      
1        1
2        2
3        1
5        1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...