По моему предложению, если у вас есть outliner в целевой переменной, не просто удаляйте строки из набора данных, вместо этого пытайтесь привести их в пределах границ.
Вы можете определить верхнюю границу и нижнюю границу, но построение графического окна
import seaborn as sns
sns.boxplot(x=dataset['target Variable'])
Кроме того, вы можете подсчитать общее количество вхождений каждого значения в целевой переменной, используя
dataset['target variable'].value_counts()
А затем установите верхнюю и нижнюю границу, используя следующий код
dataset.loc[dataset['target variable'] > upper_bound, 'target variable'] = upper_limit
dataset.loc[dataset['target variable'] < Lower_bound, 'target variable'] = Lower_limit