Pandas среднее значение после определенной даты - PullRequest
1 голос
/ 08 января 2020

Мне нужна помощь в групповом и расширенном среднем в python pandas.

Я пытаюсь использовать pandas расширяющее среднее и в групповом. На этом изображении ниже я хочу сгруппировать с помощью столбца id и увеличить среднее значение по дате. Но выгода для января, я не использую расширяющее средство. Например, вы можете думать, что январь может быть прошедшим месяцем, и взять общее среднее значение столбца значения и группировки по идентификаторам.

Для февраля и марта я хочу использовать расширяющийся столбец среднего значения в верхней части января. Таким образом, для 7 февраля и идентификатора 1 столбец 44,5 в расширяющейся средней является в основном средним значением января до того, как значение 89 наступит сегодня. Следующее значение для id 1 - 7 марта, которое включает предыдущее значение 89 7 февраля для id = 1.

Так что, в принципе, моя идея состоит в том, чтобы перенести общее среднее значение до 1 февраля, а затем использовать расширение среднее значение поверх любого среднего значения, рассчитанного до этой даты.

id    date    value   count(prior)   expanding mean (after feb)
1     1-Jan    28      4              44.75
2     1-Jan    43      3              37.33
3     1-Jan    69      3              57.00
1     2-Jan    31      4              44.75
2     2-Jan    22      3              37.33
1     7-Jan    82      4              44.75
2     7-Jan    47      3              37.33
3     7-Jan    79      3              57.00
1     8-Jan    38      4              44.75
3     8-Jan    23      3              57.00
1     7-Feb    89      4              44.75
2     7-Feb    22      3              37.33
3     7-Feb    80      3              57.00
2     19-Feb   91      4              33.50
3     19-Feb   97      4              62.75
1     7-Mar    48      5              53.60
2     7-Mar    98      5              45.00
3     7-Mar    35      5              69.60

Я дал столбцы подсчета в качестве ссылки на то, как увеличивается число. Это в основном означает все до этой даты.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...