У меня проблемы с запуском predict
после запуска линейной регрессии, потому что я не могу понять, какие переменные X на самом деле включены в линейную регрессию.
Допустим, я запускаю модель:
model1 <- lm(outcome ~ employee + shape + size + color + I(color^2)
data = data)
Количество наблюдений, идентифицированных в выходных данных регрессии, равно 224605.
Когда я пытаюсь запустить прогнозирование, вот так:
test = data.frame(y = predict(model1), x = data$employee)
Error in data.frame(y = predict(model1), x = data$employee) :
arguments imply differing number of rows: 224605, 233262
Я думал, что смогу получить правильное количество наблюдений, например, так:
> test = na.omit(data, cols = all.vars(model1))
> nrow(test)
[1] 207256
но это все равно не дает правильного количества наблюдений.Есть ли прямой способ получить наблюдения, фактически используемые линейной регрессией?