plm () против lm () с несколькими фиксированными эффектами - PullRequest
1 голос
/ 21 марта 2020

Я пытаюсь запустить модель с фиксированными эффектами: округ, год и штат: год. Подход lm () выглядит следующим образом:

lm <- lm(data = mydata, formula = y ~ x + county + year + state:year

, где округ, год и штат: год - все факторы.

Поскольку у меня большое количество округов, запуск модели очень медленный с использованием lm (). Больше разочаровывает, учитывая количество моделей, которые мне нужно создать, lm () производит объект гораздо большего размера, чем plm (). Эта команда plm () выдает те же коэффициенты и уровни значимости для моих основных переменных.

plm <- plm(data = mydata, formula = y ~ x + year + state:year, index = "county", model = "within"

Однако они дают существенно другой R-квадрат, Adj. R-квадрат и др. c. Я думал, что смогу решить проблему R-квадрата, вычислив R-квадрат для plm вручную:

SST <- sum((mydata$y - mean(mydata$y))^2)

fit <- (mydata$y - plm$residuals)

SSR <- sum((fit - mean(mydata$y))^2)

R2 <- SSR / SST

Я проверил код R-квадрат с помощью lm и получил тот же результат, о котором сообщил summary(lm). Однако, когда я вычислил R-квадрат для plm, я получил другой R-квадрат (и он был больше 1).

В этот момент я проверил, какие были коэффициенты для моих фиксированных эффектов в plm, и они отличались от коэффициентов в lm.

Может кто-нибудь, пожалуйста, 1) помочь мне понять, почему я получаю эти разные результаты и 2) предложить наиболее эффективный способ построения моделей, которые мне нужны и получить правильные R-квадраты? Спасибо!

...