суммирование панд в год - PullRequest
       2

суммирование панд в год

0 голосов
/ 05 ноября 2018

python3, версия для панд 0.23.4

Допустим, у нас есть пандас DataFrame следующим образом

np.random.seed(45)
df = pd.DataFrame({'A': np.random.randint(0, 10, 20)}, index = pd.to_datetime(dd).sort_values(ascending=False))

Теперь я хотел бы суммировать данные в столбце A по каждому году. Я мог бы сделать:

gf_perYear = gf.groupby(by= gf.index.year)
gf_perYear.sum()

       A
2012  11
2013   8
2014  15
2015  44
2016  13
2017  11

Однако мне интересно, если бы был способ, который позволил бы мне публиковать результаты в новом столбце до последнего дня каждого года, как показано ниже:

            A sum_per_year
2017-12-15  3           11
2017-11-27  0             
2017-07-24  5             
2017-06-28  3             
2016-11-07  4           13
2016-06-03  9             
2015-12-18  8           44
2015-10-16  1             
2015-09-18  5             
2015-07-15  9             
2015-04-09  6             
2015-03-18  8             
2015-02-18  7             
2014-10-21  8           15
2014-09-16  5             
2014-01-29  2             
2013-01-04  8            8
2012-12-28  1           11
2012-08-21  6             
2012-03-02  4             

1 Ответ

0 голосов
/ 05 ноября 2018

Вы можете использовать transform

gf_perYear = gf.groupby(by= gf.index.year)
gf['new'] = gf_perYear.transform('sum')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...