Мне нужна помощь в групповом и расширенном среднем в python pandas.
Я пытаюсь использовать pandas расширяющее среднее и в групповом. На этом изображении ниже я хочу сгруппировать с помощью столбца id и увеличить среднее значение по дате. Но выгода для января, я не использую расширяющее средство. Например, вы можете думать, что январь может быть прошедшим месяцем, и взять общее среднее значение столбца значения и группировки по идентификаторам.
Для февраля и марта я хочу использовать расширяющийся столбец среднего значения в верхней части января. Таким образом, для 7 февраля и идентификатора 1 столбец 44,5 в расширяющейся средней является в основном средним значением января до того, как значение 89 наступит сегодня. Следующее значение для id 1 - 7 марта, которое включает предыдущее значение 89 7 февраля для id = 1.
Так что, в принципе, моя идея состоит в том, чтобы перенести общее среднее значение до 1 февраля, а затем использовать расширение среднее значение поверх любого среднего значения, рассчитанного до этой даты.
id date value count(prior) expanding mean (after feb)
1 1-Jan 28 4 44.75
2 1-Jan 43 3 37.33
3 1-Jan 69 3 57.00
1 2-Jan 31 4 44.75
2 2-Jan 22 3 37.33
1 7-Jan 82 4 44.75
2 7-Jan 47 3 37.33
3 7-Jan 79 3 57.00
1 8-Jan 38 4 44.75
3 8-Jan 23 3 57.00
1 7-Feb 89 4 44.75
2 7-Feb 22 3 37.33
3 7-Feb 80 3 57.00
2 19-Feb 91 4 33.50
3 19-Feb 97 4 62.75
1 7-Mar 48 5 53.60
2 7-Mar 98 5 45.00
3 7-Mar 35 5 69.60
Я дал столбцы подсчета в качестве ссылки на то, как увеличивается число. Это в основном означает все до этой даты.