В настоящее время я анализирую занятость ящиков с летучими мышами и факторы, влияющие на занятость. Чтобы определить наиболее значимые переменные, влияющие на занятость, я запускаю glm с занятостью в качестве моей переменной отклика (0 = занято / 1 = не занято) и различных объясняющих переменных, которые являются числовыми, за исключением одной категориальной переменной (с 4 уровнями Бат-бокс установлен на дереве/pole/balcony/facade).
мой код:
modelb <- glm(occupation ~ TreeCov + distance_to_water + mounted_on,
family = binomial(link="cloglog"), data = mydata)
В результате я получаю:
coefficient p value
TreeCov 0.0344
distance_to_water 0.1291
mounted_onTREE 0.7676
mounted_onFACADE 0.4319
mounted_onPOLE 0.0770
с
mounted_on <- relevel(mounted_on, ref="Tree")
ссылка меняется с балкона на дерево, и когда я запускаю модель, я получаю разные значения p для своих фиктивных переменных.
coefficient p value
TreeCov 0.0344
distance_to_water 0.1291
mounted_onBALCONY 0.45272
mounted_onFACADE 0.0122
mounted_onPOLE 0.02661
Как выбрать, какая фиктивная переменная должна быть моей ссылкой?