Я должен указать общее количество мужчин и женщин по профессии и проверить, преобладают ли в этой профессии мужчины или женщины.
Вот фрейм данных:
user_id age sex occupation zip_code
0 1 24 M technician 85711
1 2 53 F other 94043
2 3 23 M writer 32067
3 4 24 M technician 43537
4 5 33 F other 15213
Результат должен быть примерно таким:
Occupation Male Female Difference Domination (male or female dominated)
. . . . .
. . . . .
. . . . .
Я пробовал это пока:
movie_df2.groupby(['sex','occupation']).count()
Но это не работает. Буду рад любой помощи.
РЕДАКТИРОВАТЬ: Далее я сделал:
df3 = movie_df2[['sex','occupation']]
df3.head()
и получил:
sex occupation
0 M technician
1 F other
2 M writer
3 M technician
4 F other
дальше я сделал df3.groupby(['occupation','sex']).count().head()
и получил:
occupation sex
administrator F
M
artist F
M
doctor M
где мне go отсюда? теперь мне нужно подсчитать мужчин и женщин для каждого занятия.