Я наткнулся на сомнение по поводу использования dropvels в моем наборе данных. У меня есть 4 фактора в моем «столбце заболеваний».
BD$Etiología <- factor(BD$Etiología, levels=c(0,1,2,3,4) ,labels= c("Control","Idiop","LMNA","BAG3","Isquémica"), ordered=FALSE)
Затем я делаю подмножество, чтобы просто сравнить контрольные случаи с одним заболеванием.
BD_C_ID <- subset(BD, Etiología=="Control" | Etiología=="Idiop")
BD_C_ID$Etiología= droplevels(BD_C_ID$Etiología) ; BD_C_ID$Etiología
[1] Control Control Control Control Control Control Control Idiop Idiop Control Control Control
[13] Контрольный Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп Идиоп [25] Idiop Idiop Control Control Control Control Idiop Control Control Control Control Control [37] Идиоп Идиоп Идиоп Идиоп Уровни: Control Idiop
Поскольку первый фактор был неупорядоченным, я просто отбрасываю уровни, которые не использую. ¿Могу ли я рассматривать их как значение с кодом 0-1, чтобы использовать их в регрессии lm или логистической c? ¿Или возникнет проблема?
Кроме того, ¿применимо ли это, если я использую Control VS BAG3 (0–3 в исходном коде?)? Или мне нужно будет изменить их уровень, чтобы его коэффициенты повторного применения 0-1?