У меня есть таблица со средним значением переменной (бюджета) по группам (размер и строгость) и p-значением критерия Крускалла-Уоллиса между бюджетом и строгостью (отдельно для каждой группы размеров, поэтому сравнение не проводится) Вот). Я делаю код отдельно, а затем объединяю все в Excel, так как я не знаю, как настроить код, чтобы получить автоматически. Каждый раз, когда я изменяю данные, мне приходится снова составлять таблицу. А также у меня есть несколько переменных, для которых мне нужно сделать это, что занимает много времени.
У меня есть следующий код:
small2017 <- subset(total2017, size=="Small")
medium2017 <- subset(total2017, size=="Medium")
large2017 <- subset(total2017, size=="Large")
library(dplyr)
total2017 %>% group_by(size, strictness) %>%
summarise(mean=mean(budget, na.rm=TRUE), sd=sd(budget, na.rm=TRUE), n=n()) %>%
filter(!is.na(strictness))
Kruskal.test(budget ~ strictness, data=small2017)
Kruskal.test(budget ~ strictness, data=medium2017)
Kruskal.test(budget ~ strictness, data=large2017)
Я сделал это в Excel и скопировал его в латекс.
Пример моих данных вы можете найти ниже:
example <- tibble::tribble(
~size, ~budget, ~strictness,
"Small", "11,718183", 1L,
"Medium", "5,264815", 2L,
"Large", "-0,43848", NA,
"Small", "0,658158", 2L,
"Medium", "-1,2867", 3L,
"Large", "-0,8482", 2L,
"Small", "4,584138", 1L,
"Medium", "7,26868", 1L,
"Large", "-7,1868", NA,
"Small", "8,186884", 1L,
"Medium", "16,1548", NA,
"Large", "1,516844", 2L,
"Small", "-5,1687", 2L,
"Medium", "11,15687", 2L,
"Large", "-4,1867", 3L,
"Small", "7,25687", 3L,
"Medium", "5,1682186", 1L,
"Large", "-6,186515", 2L,
"Small", "7,2687", 3L
)
head(example)
#> # A tibble: 6 x 3
#> size budget strictness
#> <chr> <chr> <int>
#> 1 Small 11,718183 1
#> 2 Medium 5,264815 2
#> 3 Large -0,43848 NA
#> 4 Small 0,658158 2
#> 5 Medium -1,2867 3
#> 6 Large -0,8482 2
Создано в 2020-04-30 по представ пакет (v0.3.0)