Сохранение пользовательского индекса даты / столбца после агрегирования панд? - PullRequest
0 голосов
/ 24 апреля 2018

Итак, я пытаюсь объединить фрейм данных панд по ежедневным данным на основе столбца datetime64[ns], который в нем содержится. В частности, я пытаюсь получить некоторую статистику, основанную на каждой неделе в данных (не имеет значения, где определена неделя для начала, хотя знание / настройка, что также было бы неплохо).

Мои данные таковы,

enter image description here

, с моим кодом агрегирования

grouped=mergedFinal.groupby(mergedFinal['DATE'].map(lambda x:x.week)).agg('mean')

В выводе, который я получаю, отсутствуют данные, по которым агрегируется каждая группа, что обычно включается, если вы агрегируете по категориальному значению:

enter image description here

Дата 1, 2, 3 и т. Д. Ничего не говорит мне, даже если агрегация работает правильно.

Так как бы я это сделал при отображении данных за недели? Буду признателен за любую опытную помощь в этом вопросе.

1 Ответ

0 голосов
/ 24 апреля 2018

Использование resample:

 df.resample('W', on='DATE').mean()

MCVE:

np.random.seed(123)
df = pd.DataFrame({'DATE':pd.date_range('2018-01-03',periods=30),'USD1':np.random.random(30)})

df.resample('W',on='DATE').mean()

Выход:

                USD1
DATE                
2018-01-07  0.496049
2018-01-14  0.576283
2018-01-21  0.360541
2018-01-28  0.628077
2018-02-04  0.378686
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...