Я пытаюсь запустить модель с фиксированными эффектами: округ, год и штат: год. Подход lm () выглядит следующим образом:
lm <- lm(data = mydata, formula = y ~ x + county + year + state:year
, где округ, год и штат: год - все факторы.
Поскольку у меня большое количество округов, запуск модели очень медленный с использованием lm (). Больше разочаровывает, учитывая количество моделей, которые мне нужно создать, lm () производит объект гораздо большего размера, чем plm (). Эта команда plm () выдает те же коэффициенты и уровни значимости для моих основных переменных.
plm <- plm(data = mydata, formula = y ~ x + year + state:year, index = "county", model = "within"
Однако они дают существенно другой R-квадрат, Adj. R-квадрат и др. c. Я думал, что смогу решить проблему R-квадрата, вычислив R-квадрат для plm
вручную:
SST <- sum((mydata$y - mean(mydata$y))^2)
fit <- (mydata$y - plm$residuals)
SSR <- sum((fit - mean(mydata$y))^2)
R2 <- SSR / SST
Я проверил код R-квадрат с помощью lm
и получил тот же результат, о котором сообщил summary(lm)
. Однако, когда я вычислил R-квадрат для plm
, я получил другой R-квадрат (и он был больше 1).
В этот момент я проверил, какие были коэффициенты для моих фиксированных эффектов в plm
, и они отличались от коэффициентов в lm
.
Может кто-нибудь, пожалуйста, 1) помочь мне понять, почему я получаю эти разные результаты и 2) предложить наиболее эффективный способ построения моделей, которые мне нужны и получить правильные R-квадраты? Спасибо!