Pandas timestamp - PullRequest
       7

Pandas timestamp

0 голосов
/ 20 сентября 2018

Я хотел бы сгруппировать свои данные за день и рассчитать среднесуточное значение настроения.

У меня проблема с фреймом данных pandas , потому что я не могу преобразовать свою датустолбец в метка даты для использования функции groupby().Вот мой пример данных:

   sentiment              date
0  1  2018-01-01 07:37:07+00:00
1  0  2018-02-12 06:57:27+00:00
2  -1  2018-09-18 06:23:07+00:00
3  1 2018-09-18 07:23:10+00:00
4  0  2018-02-12 06:21:08+00:00

1 Ответ

0 голосов
/ 20 сентября 2018

Я думаю, что нужно resample - это создает полное DatatimeIndex:

df['date'] = pd.to_datetime(df['date'])

df1 = df.resample('D',on='date')['sentiment'].mean()
#if want remove NaNs rows
df1 = df.resample('D',on='date')['sentiment'].mean().dropna()

Или groupby и агрегирует mean с date с или floor для времени удаления:

df2 = df.groupby(df['date'].dt.date)['sentiment'].mean()
#DatetimeIndex in output
df2 = df.groupby(df['date'].dt.floor('d'))['sentiment'].mean()
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...