Question

Я работаю над набором данных Titani c и хочу вменять недостающие значения возраста. Я хочу вменять на основе Pclass и пола - например, взяв среднее значение для всех женщин в первом классе на пропущенные женщины первого класса (очевидно, делая это для каждого класса, и для мужчин, и для женщин).

Я чувствую например, что-то вроде df.groupby (['Pclass', 'Sex']) будет работать для группировки Pclass и Sex, тогда я мог бы вменять возраст на основе этих характеристик.

Я также рассмотрел от al oop до l oop через столбцы классов и пола, но не уверен, как это будет выглядеть.

Я не включил код, поскольку все, что я сделал до эта точка опускается в столбец Cabin и подсчитывает, сколько пропущенных значений там используется с помощью df.isna (). sum ().

Любые предложения о том, как вменять условные значения, содержащиеся в других столбцах, будут оценены.

shyam_gupta · Answer 1 · 18 июня 2020

проверьте этот источник для изучения вменения значений

эта статья мне очень помогла

https://machinelearningmastery.com/handle-missing-data-python

Условное вменение значений других столбцов - набор данных Titani c Условное вменение возраста по классу и полу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Условное вменение значений других столбцов - набор данных Titani c Условное вменение возраста по классу и полу

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы