Какую фиктивную переменную выбрать в качестве ссылки в glm? - PullRequest
1 голос
/ 04 октября 2019

В настоящее время я анализирую занятость ящиков с летучими мышами и факторы, влияющие на занятость. Чтобы определить наиболее значимые переменные, влияющие на занятость, я запускаю glm с занятостью в качестве моей переменной отклика (0 = занято / 1 = не занято) и различных объясняющих переменных, которые являются числовыми, за исключением одной категориальной переменной (с 4 уровнями Бат-бокс установлен на дереве/pole/balcony/facade).

мой код:

modelb <- glm(occupation ~ TreeCov + distance_to_water + mounted_on, 
  family = binomial(link="cloglog"), data = mydata)

В результате я получаю:

coefficient         p value
TreeCov             0.0344         
distance_to_water   0.1291   
mounted_onTREE      0.7676   
mounted_onFACADE    0.4319     
mounted_onPOLE      0.0770

с

mounted_on <- relevel(mounted_on, ref="Tree")

ссылка меняется с балкона на дерево, и когда я запускаю модель, я получаю разные значения p для своих фиктивных переменных.

coefficient         p value
TreeCov             0.0344         
distance_to_water   0.1291   
mounted_onBALCONY   0.45272   
mounted_onFACADE    0.0122     
mounted_onPOLE      0.02661

Как выбрать, какая фиктивная переменная должна быть моей ссылкой?

...