Я пытаюсь вменять отсутствующие значения моего «возраста» с помощью медианы после группировки данных моего фрейма данных по полу и стране с помощью приведенного ниже кода. Мои данные фрейма данных представляют собой конкатенацию наборов данных поезда (2670 строк × 8 столбцов) и тестовых (297 строк × 7 столбцов) для последующего машинного обучения. Однако я получаю следующую ошибку: ValueError: Несоответствие длины: ожидаемая ось имеет 2966 элементов, новые значения содержат 2967 элементов
# Filling missing age data : Create a groupby object: by_sex_country
by_sex_country = data.groupby(['sex', 'country'])
# Write a function that imputes median
def impute_median(series):
return series.fillna(series.median())
# Impute age and assign to covid_train['age']
data.age = by_sex_country['age'].transform(impute_median)
Пожалуйста, помогите мне исправить эту ошибку (я не получаю эту ошибку, когда применяю тот же код только на данных поезда)