Привет, у меня есть данные следующим образом:
import pandas as pd
import numpy as np
загрузка данных в фрейм данных
X = pd.read_csv('demo.csv')
интересуют два столбца: столбец Категория и итоги:
Category Totals estimates
A 2777 0.43
B 1003 0.26
D NA 0.65
D 2638 0.17
B NA 0.74
C 2196 0.13
D 2630 0.91
A NA 0.39
C 2472 0.51
B 1090 0.12
C NA 0.64
Я могу найти медиану категории A
как:
df.groupby('Category').Totals.median().loc['A']
Мне нужна помощь для достижения следующего:
- Мне нужно найти медиану всех категорий сразу, а не по одной.
- Затем мне нужно вменять пропущенные значения в столбце
Totals
по медиане соответствующей категории.
Помощь будет принята с благодарностью.