Почему мой glm все еще анализирует несколько переменных, когда я использую as.factor ()? - PullRequest
1 голос
/ 16 мая 2019

Я пытаюсь запустить glm, который рассматривает влияние типа пищи, среды обитания и периода голодания на предпочтение пищи у муравьев, однако я просто хочу смотреть на тип пищи как на единый фактор, хотя я предоставляю муравьевс 5 ед.Я использовал as.factor для переменной food, но она все еще не работает!Я хочу одно значение p для того, как еда влияет на людей.Я что-то упустил?

  NumofAnts FoodType Trial SiteType
1         0     Pink     1  natural
2         4     Pink     1  natural
3         5     Pink     1  natural
4         4     Pink     1  natural
5         8     Pink     1  natural
6         5     Pink     1  natural
fit<-glm(NumofAnts~as.factor(FoodType) + Trial + SiteType, 
family=poisson(link=log), data=stacked1)
glm(formula = NumofAnts ~ as.factor(FoodType) + Trial + SiteType, 
    family = poisson(link = log), data = stacked1)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-3.5644  -2.2495  -1.0023   0.8588   8.8051  

Coefficients:
                          Estimate Std. Error z value Pr(>|z|)    
(Intercept)                1.46177    0.08031  18.202  < 2e-16 ***
as.factor(FoodType)Blue   -0.66665    0.06824  -9.769  < 2e-16 ***
as.factor(FoodType)Green  -0.29987    0.06093  -4.922 8.57e-07 ***
as.factor(FoodType)Yellow -0.28086    0.06060  -4.635 3.57e-06 ***
as.factor(FoodType)Red    -0.92502    0.07459 -12.401  < 2e-16 ***
Trial                      0.19355    0.04327   4.473 7.73e-06 ***
SiteTypeurban             -0.19730    0.04328  -4.558 5.16e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

1 Ответ

0 голосов
/ 16 мая 2019

GLM оценит один коэффициент (то есть одно значение p), когда переменная является числовой. Но когда переменная является категориальной (например, food в вашем случае), она вычислит один коэффициент для каждого уровня (кроме одного) вашей переменной. В вашем случае food имеет 5 уровней, поэтому оцениваются 4 коэффициента (то есть 4 значения p).

...