Как получить среднее значение «определенного» значения столбца в группе с помощью панд - PullRequest
0 голосов
/ 30 апреля 2018

У меня есть простой тестовый код, как показано ниже, и я хочу знать среднюю зарплату каждого отдела. В частности, «продажи», но когда я использую групповую на «Dept» и делаю среднее значение, я получаю среднее значение всех отделов.

df = pd.DataFrame({"Dept":["sales", "engg", "mkt", "sales", "engg","mkt", "sales", "sales", "engg", "mkt"],"Salaries": [10,5,20,15,60,25,35,40,10,20]})
df.groupby("Dept")["Salaries"].mean()

Dept
engg     25.000000
mkt      21.666667
sales    25.000000
Name: Salaries, dtype: float64

Однако, если я хочу получить среднее значение «продажи», я делаю следующее. Я хочу знать, есть ли лучший способ сделать то же самое, используя groupby и вытащить среднее значение определенного столбца (в данном случае «продажи») «)

df[df["Dept"]=="sales"]["Salaries"].mean()

25.0

1 Ответ

0 голосов
/ 30 апреля 2018
df.groupby("Dept")["Salaries"].mean()['sales']

но зачем тебе это? Это, вероятно, более ресурсоемкий

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...