сделал моделирование в R - правильная настройка данных в шахматном порядке - PullRequest
0 голосов
/ 02 февраля 2020

Я ценю любые идеи о шахматных (разностных) моделях.

Я хотел спросить, использую ли я правильную функцию для настройки модели для дел (структура данных представлена ​​ниже) :

did=time*treated

didreg = lm(y ~ time + treated + did + x + factor(year) + factor(firm), data = sample)

Данные выглядят так:

enter image description here

1 Ответ

0 голосов
/ 03 февраля 2020

Я не знаком с моделированием различий в разностях, но из просмотра вики кажется, что вам нужно простое взаимодействие. Для этого вам даже не нужно вычислять новую переменную (did), но вы можете указать ее непосредственно в модели. Есть несколько способов указать, что с синтаксисом формулы R:

# Simple main effects models, no interactions
main_mod <- lm(y ~ time + treated + x + factor(year) + factor(firm), data = sample)

# Model with the interaction effect explicitly specified
did_mod1 <- lm(y ~ time + treated + time:treated + x + factor(year) + factor(firm), data = sample)

# Model with shortened syntax for specifying interactions
did_mod2 <- lm(y ~ time * treated + x + factor(year) + factor(firm), data = sample)

did_mod1 и did_mod2 идентичны, did_mod2 - это просто более компактный способ написания одной и той же модели. * означает, что вам нужны как основные эффекты, так и взаимодействия переменных слева и справа. Рекомендуется всегда подбирать основные эффекты при подборе взаимодействий, поэтому второй способ написания модели экономит время и пространство.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...