Почему я получаю одинаковые значения p для разных категориальных переменных, когда я использовал односторонний anova в r? - PullRequest
0 голосов
/ 02 апреля 2020

У меня есть зависимая переменная типа непрерывного типа и независимая переменная (4) типа категориального с более чем 2 уровнями (неупорядоченный).

 dput(head(subset_data,5))
structure(list(cat1 = structure(c(15L, 7L, 
15L, 13L, 7L)), class = "factor"),cat2 = structure(c(5L, 5L, 5L, 5L, 5L)), class = "factor"), 
cat3 = structure(c(51L, 51L, 46L, 46L, 44L)), class = "factor"), 
cat4 = structure(c(1L,1L, 1L, 1L, 2L)),  class = "factor"),
var1 = c(27L, 36L, 10L,9L, 26L)), row.names = c(32L, 33L, 38L, 40L, 41L), class = "data.frame")

Я попробовал односторонний тест на анову, чтобы узнать связь между var1 и категорические переменные. Выходные данные, как показано ниже.

var1 vs cat1 :
aov_cat1 <- aov(var1 ~ cat1, data = subset_data)
# Summary of the analysis
summary(aov_cat1)
Output:
           Df    Sum Sq   Mean Sq  F value   Pr(>F)    
cat1       14   6686217   477587   285.9     <2e-16 ***
Residuals  97691 163185376 1670                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
var1 vs cat2 :
aov_cat2 <- aov(var1 ~ cat2, data = subset_data)
# Summary of the analysis
summary(aov_cat2)
Output:
                Df    Sum Sq Mean Sq F value Pr(>F)    
cat2            5    488349   97670   56.34 <2e-16 ***
Residuals     97700 169383244 1734                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
var1 vs cat3 :
aov_cat3 <- aov(var1 ~ cat3, data = subset_data)
# Summary of the analysis
summary(aov_cat3)
Output:

           Df    Sum Sq   Mean Sq  F value Pr(>F)    
cat3       51   14882835  291820   183.9   <2e-16 ***
Residuals 97654 154988758 1587                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
var1 vs cat4 :
aov_cat4 <- aov(var1 ~ cat4, data = subset_data)
# Summary of the analysis
summary(aov_cat4)
               Df    Sum Sq Mean Sq  F value   Pr(>F)    
cat4           3    4851874  1617291   957.5   <2e-16 ***
Residuals   97702  165019719 1689                   
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Я получаю значение pr (> F) одинаковым для 4 категориальных переменных относительно значений var1 и F. Какова интерпретация этого и можем ли мы визуализировать связь между непрерывными и категориальными переменными?

Можем ли мы использовать однофакторный анова для связи между непрерывными и категориальными переменными (для более чем двух уровней).

Пожалуйста, предложите мне идеи на этот счет.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...