Я пытаюсь удалить выбросы из моего набора данных:
Outliers <- Overallproportionofcorrecttrials %>%
group_by(Condition,Distancetotarget) %>%
identify_outliers(Proportionofcorrecttrials)
Condition Distancetotarget Proportionofcorrecttrials ID is.outlier is.extreme
<dbl> <dbl> <dbl> <chr> <lgl> <lgl>
1 0 320. 0.6 P_200220145557 TRUE FALSE
2 2 63.2 0.8 P_200220145557 TRUE FALSE
3 2 94.8 0.8 P_200220145557 TRUE FALSE
4 2 142. 1 P_200220145557 TRUE TRUE
5 2 213 . 1 P_200220145557 TRUE FALSE
6 2 320 0.4 P_200217101213 TRUE TRUE
7 2 320 0.2 P_200219163622 TRUE FALSE
8 . 2 . 320 . 0.4 P_200220145557 TRUE FALSE
Я получаю вывод выше.
Прав ли я в , удаляя все точки данных выше которых соответствует OUTLIER = TRUE в качестве следующего шага, чтобы сделать анализ максимально точным / правдивым?
Или я могу удалить только точки данных для EXTREME = TRUE?
Когда я удаляю эти выбросы, обе мои переменные внутри субъекта становятся значительными , а не только один до удаления (двусторонние повторные измерения ANOVA).
Кроме того, когда я проверяю выбросы после того, как удаляю выбросы, указанные выше, это дает мне следующий вывод:
Condition Distancetotarget Proportionofcorrecttrials ID is.outlier is.extreme
<dbl> <dbl> <dbl> <chr> <lgl> <lgl>
1 2 213. 0.4 P_200217101213 TRUE FALSE
2 2 213. 0.4 P_200224092247 TRUE FALSE
3 2 213. 0.4 P_200225171612 TRUE FALSE
И, таким образом, это выглядит как бесконечный l oop?
Может ли кто-нибудь протянуть руку помощи?