питон панды - группировка по дате и количеству - PullRequest
0 голосов
/ 05 сентября 2018

У меня есть данные ниже. Дата в ДД / ММ / ГГ

Date                        id     
1/5/2017 2:00 PM            100
1/5/2017 3:00 PM            101
2/5/2017 10:00 AM           102
3/5/2017  09:00 AM          103
3/5/2017  10:00 AM          104
4/5/2017  09:00 AM          105 

Нужно выводить таким образом, чтобы, умея группировать по дате, а также подсчитывать количество идентификаторов в день, также игнорировать время. o / p новый фрейм данных должен быть как показано ниже

DATE           Count
1/5/2017        2           -> count 100,101
2/5/2017        1
3/5/2017        2
4/5/2017        1

Нужен эффективный способ для достижения выше.

1 Ответ

0 голосов
/ 05 сентября 2018

Использование:

df['Date'] = pd.to_datetime(df['Date'], dayfirst=True)

df1 = df['Date'].dt.date.value_counts().sort_index().reset_index()
df1.columns = ['DATE','Count']

Альтернативное решение:

df1 = df.groupby(df['Date'].dt.date).size().reset_index(name='Count')

print (df1)
         DATE  Count
0  2017-05-01      2
1  2017-05-02      1
2  2017-05-03      2
3  2017-05-04      1

Если нужен тот же формат:

df1 = df['Date'].str.split().str[0].value_counts().sort_index().reset_index()
df1.columns = ['DATE','Count']

new = df['Date'].str.split().str[0]
df1 = df.groupby(new).size().reset_index(name='Count')
print (df1)
       Date  Count
0  1/5/2017      2
1  2/5/2017      1
2  3/5/2017      2
3  4/5/2017      1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...