Невозможно сгруппировать даты, чтобы получить среднее значение в Pandas из-за отметок времени - PullRequest
0 голосов
/ 11 февраля 2020

Trying to get the mean sentiment by day, but cannot figure it out.

У меня есть список значений настроений в твиттере и отметок времени твитов. Я хочу получить среднесуточные значения, но не могу избавиться от значений меток времени, поэтому моя группа не работает.

Ответы [ 2 ]

1 голос
/ 11 февраля 2020

Вы можете сделать это:

начальный df:

    Date                        Sentiment
0   2020-01-31 00:00:00+00:00   0.6369
1   2020-01-31 01:00:00+00:00   0.3612

Код:

df['Date']=pd.to_datetime(df['Date'], utc=False)
df['Date']=df['Date'].dt.date

df.groupby('Date')['Sentiment'].mean()

Выход:

Date
2020-01-31    0.49905
Name: Sentiment, dtype: float64

окончательный df:

    Date        Sentiment
0   2020-01-31  0.6369
1   2020-01-31  0.3612
0 голосов
/ 11 февраля 2020

Найдено: { ссылка }

df = df.groupby ([df ['Date_Time']. Dt.date]). Mean ()

...