У меня проблемы с составлением запроса, который фильтрует существующий фрейм данных, чтобы показать количество имен, одинаковых как для мужчин, так и для женщин.
Мы назначили имя как женское, если число женщин и мужчин было одинаковым. Напишите фильтр на основе dF_ssa5 DataFrame, чтобы подсчитать и распечатать, сколько раз это происходит и сколько всего имен.
With df_ssa5 being a given dataframe;
df_ssa5 = df_ssa4.groupBy("name").sum("F","M").withColumnRenamed("sum(F)","women").withColumnRenamed("sum(M)","men")
df_ssa5.show()
Если бы кто-нибудь мог помочь, это было бы здорово.
Желаемый результат будет примерно таким, но с теми же именами и количеством отображаемых имен, как для мужчин, так и для женщин: