Направление изменения модели панельных данных - PullRequest
0 голосов
/ 27 мая 2020

Я новичок в STATA. И я попытался прояснить этот вопрос, используя «dataex», но мои данные очень большие, около 5 миллионов наблюдений, поэтому я не уверен, как это сделать. Я постараюсь описать свой вопрос как можно точнее:

У меня есть панель из примерно 500 000 деревень за 10 (2004-2013) лет, так что всего у меня 5 миллионов наблюдений. Вот описание переменной

  1. У меня интересующая переменная y
  2. Есть дата отсечения 2009, когда есть экзогенные вариации, из-за которых может быть 4 способа в котором статус деревни может измениться. Ранее не лечили, а после 2009 г. также не лечили (пустышка M1) Ранее не лечили, а после лечения 2009 г. (пустышка M2) Ранее лечили, а после 2009 г. не лечили (пустышка M4) До лечения, а также после лечения 2009 г. (пустышка M2) M5)
  3. Я создаю переменную с вызовом «Лечение» = 1 (0, в противном случае), когда деревня обрабатывается либо после, либо до 2009 года, либо и того, и другого.
  4. Я создаю переменную с вызовом «Контроль» = 1 (0, в противном случае), если деревня не обрабатывается ни после, ни до 2009 года, либо и того, и другого.
  5. Ключ - уникальный идентификатор деревни
  6. Год - переменная времени

Я запускаю следующий код, чтобы увидеть влияние на y, когда состояние деревни меняется с контроля на лечение, я запускаю следующую команду:

reghdfe y Treatment , absorb(i.key , i.year)

Это дает мне следующий вывод (здесь обрабатывается S C): Вывод 1

Это выглядит нормально, Чтобы проверить, соответствует ли направление (когда лечение становится контролем или контроль становится лечением) tter или нет: я оцениваю следующее (без кластеризованного SE):

reghdfe avg_light SC##M2 SC##M4, absorb(i.key i.year)

И я получаю следующее:

Output2

И здесь большая часть переменных и взаимодействий опущена, и я не понимаю почему. Как я могу решить эту проблему?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...