Я пытаюсь выполнить пошаговую регрессию, но вывод, который я получаю, короче, чем фрейм входных данных.Я не могу поделиться своими данными, к сожалению, но любая помощь будет высоко ценится.Заранее спасибо!
#training data
a3<-na.omit(train_occur)
sum(is.na(train_occur))
> 0
dim(a3)
>2228 10
full_log<-glm(formula = occurrence ~ . , family=binomial(link=logit), data= train_occur, control = list(maxit = 50))
back_log_occur<-step(full_log)
length(back_log_occur$fitted.values)
>66
#test data
dim(test_occur) #I took out the response variable although I found it doesn't seem to matter whether or not the response variable is there...
>243 9
pred_back_log_occur<-predict(object=back_log_occur,data=test_occur,type="response")
length(pred_back_log_occur)
> 66
Я ожидал 2228 подходящих значений для обучения и 243 прогнозируемых значений для тестового набора.