Я пытаюсь: 1- определить критерии выбросов (вверх (привет) и низкий (ло)).3- Вычислить каждое наблюдение (для каждого столбца). 2- Отметить выбросы
. Мой набор данных, h_median (pandas dataframe), имеет 30 столбцов и 4 строки, поэтому мне нужен цикл для него.Я нахожусь в точке определения критериев:
def remove_outlier(h_median,variables):
q1 = h_median[variables].quantile(0.25)
q3 = h_median[variables].quantile(0.75)
iqr = q3-q1 #Interquartile range
fence_low = q1-1.5*iqr
fence_high = q3+1.5*iqr
df_out = h_median.loc[(h_median[variables]> fence_low) &
(h_median[variables]< fence_high)]
return df_out`
Спасибо!