Я очищаю этот набор данных для проблемы машинного обучения, и я могу найти в столбце трицепса числа, которые были числами в миллиметрах, как описано в описании набора данных. Многие значения представляют собой однозначные числа, что невозможно, так как размер трицепса составляет 7 мм вhuman.So, как я могу исправить это или любое масштабирование объектов, которое может помочь?
Сначала я удалил нулевые значения и преобразовал число с плавающей точкой в целые числа, которые все
df['triceps'].fillna(df['triceps'].mean() , inplace=True)
df['triceps'] = df['triceps'].astype(int).round()
Это значенияколонка:
Triceps
7
7
13
9
9
9
3
8
8
4
6
6
8
7
5
Я просто хотел сделать эти значения значимыми, так как 7 мм трицепс невозможен.