Pandas сгруппировать, чтобы получить среднее значение в определенном формате - PullRequest
1 голос
/ 30 января 2020

У меня есть следующий фрейм данных df:

Out [15]:

                     Run_299  Run_300      Month       Date       bkt
DateTime                                                            
2024-12-31 21:00:00  13       18           2024-12-01 2024-12-31  p
2024-12-31 21:00:00  11       12           2024-12-01 2024-12-31  p
2024-12-31 22:00:00  2         5           2024-12-01 2024-12-31  q
2024-12-31 23:00:00  113     118           2024-12-01 2023-11-30  p
2025-01-01 00:00:00  110     114           2025-01-01 2023-11-30  p

Я пытаюсь получить следующие средние вычисления:

Date        bkt   mean
2024-12-31  p     13.5
2023-11-30  q     3.5
2023-11-30  p     113.75

Где:

13.5 = average(13, 18, 11, 12)
3.5 =average(2, 5)
113.75=average(113, 118, 110, 114)

Я пытался:

df.groupby(['Date', 'bkt']).mean()

Но в среднем не получается, как ожидалось. Я все еще получаю столбцы Run_299 и Run_300

Редактировать:

Я изменил average, чтобы показать, что я пытаюсь вычислить среднее значение

Ответы [ 2 ]

2 голосов
/ 30 января 2020

Используйте melt перед групповым

df_final = (df.melt(['Month','Date','bkt'], value_name='Run_mean')
              .groupby(['Date', 'bkt']).mean())    

Out[202]:
                Run_mean
Date       bkt
2023-11-30 p      113.75
2024-12-31 p       13.50
           q        3.50
0 голосов
/ 30 января 2020

IIU C с использованием stack и groupby

new_df = (
    df.set_index(["Date", "bkt"])
    .filter(like="Run")
    .stack()
    .groupby(level=[0, 1])
    .mean()
    .reset_index()
    .rename(columns={0: "Run Mean"})
)

print(new_df)

       Date bkt  Run Mean
0 2023-11-30   p    113.75
1 2024-12-31   p     13.50
2 2024-12-31   q      3.50
...