Я не знаком с моделированием различий в разностях, но из просмотра вики кажется, что вам нужно простое взаимодействие. Для этого вам даже не нужно вычислять новую переменную (did
), но вы можете указать ее непосредственно в модели. Есть несколько способов указать, что с синтаксисом формулы R:
# Simple main effects models, no interactions
main_mod <- lm(y ~ time + treated + x + factor(year) + factor(firm), data = sample)
# Model with the interaction effect explicitly specified
did_mod1 <- lm(y ~ time + treated + time:treated + x + factor(year) + factor(firm), data = sample)
# Model with shortened syntax for specifying interactions
did_mod2 <- lm(y ~ time * treated + x + factor(year) + factor(firm), data = sample)
did_mod1
и did_mod2
идентичны, did_mod2
- это просто более компактный способ написания одной и той же модели. *
означает, что вам нужны как основные эффекты, так и взаимодействия переменных слева и справа. Рекомендуется всегда подбирать основные эффекты при подборе взаимодействий, поэтому второй способ написания модели экономит время и пространство.