У меня есть большой массив данных pandas с 10000 строками и 33 столбцами.Один из столбцов - «Возраст» с типом данных «int64» и значительными пропущенными значениями.
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 10000 entries, 0 to 9999
Data columns (total 33 columns):
customer 10000 non-null int64
age 10000 non-null int64
Отсутствующие значения были записаны как 0 в данных.Пропущенные значения:
df['customer'][df[' age']==0].count()
>2942
Я пытаюсь заменить все такие 0 на медиану:
df[' age'].replace(to_replace=0, value = df[' age'].median, inplace = True)
Кажется, все работает нормально.Но он изменяет тип данных столбца на O:
df[' age'].dtype
>dtype('O')
Что не так?