Python 3D Dataframe: сортировка значений по столбцам и получение среднего - PullRequest
0 голосов
/ 26 марта 2020

Я какое-то время искал решение для stackoverflow и пока не нашел никакого решения. Надеюсь, вы поможете мне:

У меня есть фрейм данных с 3 столбцами ['Attrition', 'JobRole', 'MonthlyIncome']

Я отсортировал фрейм данных по разным значениям для Attrition. (ДА / НЕТ) и его различные JobRoles и хотите получить среднее значение ежемесячного дохода

, например, для истощения == Да и JobRole == 'Healthcare' -> 'MonthlyIncome' = x

avg_inc=df[['Attrition', 'MonthlyIncome', 'JobRole']].sort_values(['Attrition', 'JobRole'])
'''




  [1]: https://i.stack.imgur.com/8cvYy.png


I hope anyone can help me out. Thanks in advance

1 Ответ

0 голосов
/ 27 марта 2020

Вы хотели что-то вроде / Данные

df=pd.DataFrame({'Attrition':['No','No','No','Yes','No','Yes','No','Yes'],'MonthlyIncome':[34567,7890,11234,56789,67890,65345,45782,97802], 'JobRole':['NS','DR','HD','DR','NS','HR','NS','HR']})

Группировать и рассчитать среднее

df['Mean_MonthlyIncome']=df.groupby(['JobRole','Attrition'])['MonthlyIncome'].transform('mean')

Или

df.groupby(['JobRole','Attrition'])['MonthlyIncome'].mean()
...