Я пытаюсь выучить ML, решая проблему Titanic ML в kaggle, и многие значения Age
отсутствуют. Я следую руководству, чтобы решить проблему.
, если я использую
median_age = df.groupby('Title')['Age'].transform('median')
, тогда это дает мне что-то вроде
>>>median_age.sample(12)
PassengerId
1053 4.0
891 29.0
524 35.0
570 29.0
1236 4.0
463 29.0
359 22.0
403 22.0
604 29.0
791 29.0
512 29.0
1290 29.0
Name: Age, dtype: float64
Это median ages
соответственнодля каждой категории Title
Мой вопрос -
Если я использую df['Age'].fillna(median_age, inplace=True)
, как это заполняет значения? Какова внутренняя работа этой последней строки?