Т-тест, анова, хи-квадрат в R - PullRequest
0 голосов
/ 23 февраля 2019
    1    2
y1  48  44
y2  38  39
y3  49  56
y4  3   4
y5  55  28
y6  99  101
y7  121 120
y8  2   6

1) Учитывая эту описательную статистику, где 1 и 2 - результат (Y = 1 или 2), а Y1 - Y8 - переменные, я хочу выполнить независимый t-тест с использованием неравной дисперсии.Y4 и Y8 являются двоичными переменными, и мне нужно выполнить хи-квадрат.Я хочу, чтобы результаты этих тестов были моей третьей колонкой, чтобы увидеть, какая переменная является движущим фактором различия группы (Y = 1 или 2).Как бы я мог сделать это в R?

2) Если результат меняется на три категории (Y = 1, 2 и 3), как я могу выполнить ANOVA для непрерывных переменных и хи-квадрат дляY4 и Y8 в R?


1 Ответ

0 голосов
/ 23 февраля 2019

Прежде всего, вы не должны смешивать двоичные переменные с остальными измерениями.Я начну с разделения входных данных на два.

df2 <- df1[c(4, 8), ]
df3 <- df1[-c(4, 8), ]

Теперь тесты.t.test потребуются данные в длинном формате, см. этот вопрос , чтобы узнать о других способах изменения формы набора данных.

chisq.test(df2)

long <- reshape2::melt(df3)
t.test(value ~ variable, long)

Данные в формате dput.

df1 <-
structure(list(`1` = c(48L, 38L, 49L, 3L, 55L, 
99L, 121L, 2L), `2` = c(44L, 39L, 56L, 4L, 28L, 
101L, 120L, 6L)), class = "data.frame", 
row.names = c("y1", "y2", "y3", "y4", "y5", 
"y6", "y7", "y8"))
...