У меня есть 2 столбца в наборе данных, один - Страна, другой - Пол, Пол имеет некоторые значения NaN или N / A. В pandas это выглядит так:
import pandas as pd
Country = ['United Kingdom', 'Bosnia and Herzegovina', 'Thailand', 'United States', 'Ukraine', 'Canada', 'Ukraine', 'India', 'New Zealand', 'India', 'Antigua and Barbuda', 'Canada', 'United States', 'Germany', 'India', 'United Kingdom', 'Australia', 'Russian Federation', 'Brazil', 'Lithuania']
Gender = ['Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', nan, 'Man', 'Woman', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man', 'Man']
Я хочу отобразить пропущенные значения как пропорцию всех значений Gender в категории Country. Сначала я использую groupby в столбце «Страна», который дает мне только общее количество полов в стране. Какой будет лучший способ отобразить пропущенные значения в виде доли от общего значения пола в стране:
РЕДАКТИРОВАТЬ: ответил на этот вопрос в комментариях просмотрите решение, если вы считаете, что решение могло бы быть лучше, пожалуйста, прокомментируйте под комментарием к решению.