Как исправить зашумленные данные в наборе данных машинного обучения - PullRequest
0 голосов
/ 19 сентября 2019

Я очищаю этот набор данных для проблемы машинного обучения, и я могу найти в столбце трицепса числа, которые были числами в миллиметрах, как описано в описании набора данных. Многие значения представляют собой однозначные числа, что невозможно, так как размер трицепса составляет 7 мм вhuman.So, как я могу исправить это или любое масштабирование объектов, которое может помочь?

Сначала я удалил нулевые значения и преобразовал число с плавающей точкой в ​​целые числа, которые все

df['triceps'].fillna(df['triceps'].mean() , inplace=True)    
df['triceps'] = df['triceps'].astype(int).round()

Это значенияколонка:

Triceps
7
7
13
9
9
9
3
8
8
4
6
6
8
7
5

Я просто хотел сделать эти значения значимыми, так как 7 мм трицепс невозможен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...