У меня есть данные в рамках данных о зарплатах сотрудников. У каждого сотрудника также хранятся данные о его поле, дисциплине, годах, прошедших с момента получения степени доктора наук, и годах работы в текущем работодателе. Пример данных следующий:
rank dsc phd srv sex salary
1 Prof B 19 18 Male 139750
2 Prof B 20 16 Male 173200
3 Asst B 4 3 Male 79750
4 Prof B 45 39 Male 115000
5 Prof B 40 41 Male 141500
6 Assoc B 6 6 Male 97000
7 Prof B 30 23 Male 175000
8 Prof B 45 45 Male 147765
9 Prof B 21 20 Male 119250
10 Prof B 18 18 Female 129000
То, что я хочу получить, - это средняя заработная плата всех сотрудников, сгруппированных по полу и разным стажам работы. Например; Мужчины со стажем 0-10 лет, женщины со стажем 0-10 лет, мужчины со стажем работы 11-20 лет и т. Д. Я могу получить среднее значение для ряда работников с интервалами лет, работающих без разделения на полов, делая:
serviceSalary = data.groupby(pd.cut(data['yrs.service'], np.arange(0, 70,
10)))['salary'].mean()
Что еще я могу сделать, чтобы добавить третью группу к этой переменной?