Я работаю над набором данных Titani c и хочу вменять недостающие значения возраста. Я хочу вменять на основе Pclass и пола - например, взяв среднее значение для всех женщин в первом классе на пропущенные женщины первого класса (очевидно, делая это для каждого класса, и для мужчин, и для женщин).
Я чувствую например, что-то вроде df.groupby (['Pclass', 'Sex']) будет работать для группировки Pclass и Sex, тогда я мог бы вменять возраст на основе этих характеристик.
Я также рассмотрел от al oop до l oop через столбцы классов и пола, но не уверен, как это будет выглядеть.
Я не включил код, поскольку все, что я сделал до эта точка опускается в столбец Cabin и подсчитывает, сколько пропущенных значений там используется с помощью df.isna (). sum ().
Любые предложения о том, как вменять условные значения, содержащиеся в других столбцах, будут оценены.