Я хотел запустить t-тесты в наборе данных, который имеет два фактора: A и B. У меня это работает, но без удаления выбросов.
Моя идея состоит в том, чтобы удалить значения, используя 1,5 *Критерии IQR.Я не мог понять, как сделать это, следуя способу dyplyr (?).
Вот что у меня есть:
wallSize %>%
select(Time, A, B) %>%
gather(key = variable, value = value, -A, -B) %>%
group_by(A, B, variable) %>%
summarise(value = list(value)) %>%
spread(A, value) %>%
group_by(variable) %>%
mutate(p_value = t.test(unlist(True), unlist(False), paired=TRUE)$p.value,
t_value = t.test(unlist(True), unlist(False), paired=TRUE)$statistic)))
Я думаю, что я должен сделать удаление выбросов послевыкладывать для каждого из 6 списков индивидуально, но я не могу понять, как ... Какие-либо предложения от мастеров R?
Приветствия
РЕДАКТИРОВАТЬ: Пример данных head
кадрадо группировки:
Display Change Comp TargetType TotalTime SelectionTime Score
<chr> <chr> <chr> <int> <dbl> <dbl> <int>
1 Wall Shape False 1 62.2 53.7 4
2 Wall Shape False 2 14.1 12.6 5
3 Wall Shape True 0 26.3 23.0 5
4 Wall Shape True 0 20.3 14.7 5
5 Wall Shape True 1 23.3 21.6 5
6 Wall Shape False 2 6.55 5.17 5
после группировки:
TargetType variable False True
<int> <chr> <list> <list>
1 0 SelectionTime <dbl [28]> <dbl [28]>
2 1 SelectionTime <dbl [28]> <dbl [28]>
3 2 SelectionTime <dbl [28]> <dbl [28]>