Группа DatetimeIndex по дням с пандами - PullRequest
0 голосов
/ 16 мая 2018

Я проиндексировал свой фрейм данных в DateTimeIndex следующим образом:

timstamp                 _id
2018-05-09 16:56:40.940  somedata1
2018-05-09 16:54:03.959  somedata2
2018-05-10 16:53:42.975  somedata3
2018-05-11 16:52:44.897  somedata4
2018-05-11 16:46:35.902  somedata5

И я хотел бы показать частоту каждой из дат примерно так:

day                      count
2018-05-09               2
2018-05-10               1
2018-05-11               2

Спасибо взаранее!

Ответы [ 2 ]

0 голосов
/ 16 мая 2018

str.split + groupby + count

df.groupby(df['timstamp'].str.split().str[0])._id.count().reset_index()

     timstamp  _id
0  2018-05-09    2
1  2018-05-10    1
2  2018-05-11    2

to_datetime + groupby + count

df.assign(
    timstamp=pd.to_datetime(df['timstamp']).dt.floor('D')
).groupby('timstamp', as_index=False)._id.count()

Или,

df['timstamp'] = pd.to_datetime(df['timstamp']).dt.floor('D')
df.groupby('timstamp', as_index=False)._id.count()

    timstamp  _id
0 2018-05-09    2
1 2018-05-10    1
2 2018-05-11    2
0 голосов
/ 16 мая 2018

Это один из способов.

# convert to datetime
df['timestamp'] = pd.to_datetime(df['timestamp'])

# normalize, count values, convert to dataframe
res = df['timestamp'].dt.normalize()\
                     .value_counts()\
                     .to_frame().reset_index()

# rename columns
res.columns = ['timestamp', 'count']

Результат:

print(res)

   timestamp  count
0 2018-05-09      2
1 2018-05-11      2
2 2018-05-10      1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...