Изображение показывает, что рабочий класс столбца преобразуется в числовое значение с использованием фиктивного значения, однако, когда я печатаю этот столбец, он все еще показывает dtype как объект 1 Я новичок в Data Science и учусь обрабатывать отсутствующие значения в Python версии 3.8. Я столкнулся с этой проблемой, и я не могу понять, что пошло не так. Проблема в том, что я создал макеты для столбца с именем «рабочий класс», одно из значений в этом столбце - «state-gov». Я создал макеты для этого столбца, и до тех пор код работал нормально. Однако, когда я начал вменять недостающие значения с помощью медианы, я получил следующую ошибку.
ValueError: невозможно использовать медианную стратегию с нечисловыми данными c: не удалось преобразовать строку в число с плавающей запятой: 'State-gov'
Пожалуйста, найдите код, из которого я создал манекены, прикрепленные к этому Вопросу. Заранее благодарю за помощь!
todummy_list = ['workclass', 'education', 'marital-status', 'occupation', 'relationship', 'race', 'sex', 'native-country']
def dummy_list(data_frame_features, todummy_list):
for x in todummy_list:
dummies = pd.get_dummies(df[x], prefix=x, dummy_na=False)
data_frame_features = data_frame_features.drop(x, 1)
data_frame_features = pd.concat([df, dummies], axis=1)
return data_frame_features
# filling the missing values with median
imp = SimpleImputer(missing_values='NAN', strategy='median', fill_value=None)
imp.fit(data_frame_features)
data_frame_features = pd.DataFrame(data=imp.transform(data_frame_features), columns=data_frame_features.columns)
print(f'\nRecalculated')
print(data_frame_features.isnull().sum().sort_values(ascending=False))