У меня есть датафрейм, который выглядит как в примере ниже:
year x y
2016 o 227
2018 o 214
2016 o 56
2018 o 62
2018 o 87
2019 o 40
2017 r 15
2016 i 14
2016 o 88
2014 o 48
Я хочу получить вывод, в котором среднее значение y рассчитывается на основе grouby
за год, а затем далее x
. Примерно так:
year x y
2016 o (227 + 56 + 88)/3 = 123.66 = 124 (Need just the final value)
2018 o (214 + 62 + 87)/3 = 121 (Need just the final value)
2019 o 40
2017 r 15
2016 i 14
2014 o 48
Я думаю, что нашел способ (но я мог ошибаться) сделать это, но результат оказался в некадре данных:
print(part_b[['year', 'x', 'y']].groupby(['year', 'x']).mean())
Выходные данные: (Результаты следующих выходных данных получены из моих полных данных)
y
year x
2014 o 48.000000
2016 i 14.000000
o 117.000000
2017 o 71.000000
r 27.500000
2018 i 23.000000
o 97.428571
2019 i 11.000000
o 115.500000
'''
Whereas I would like to have this:
```python
year x y
2014 o 48
2016 i 14
2016 o 117
2017 o 71
2017 r 28
2018 i 23
2018 o 97
2019 i 11
2019 o 116
'''