Я новичок в STATA. И я попытался прояснить этот вопрос, используя «dataex», но мои данные очень большие, около 5 миллионов наблюдений, поэтому я не уверен, как это сделать. Я постараюсь описать свой вопрос как можно точнее:
У меня есть панель из примерно 500 000 деревень за 10 (2004-2013) лет, так что всего у меня 5 миллионов наблюдений. Вот описание переменной
- У меня интересующая переменная y
- Есть дата отсечения 2009, когда есть экзогенные вариации, из-за которых может быть 4 способа в котором статус деревни может измениться. Ранее не лечили, а после 2009 г. также не лечили (пустышка M1) Ранее не лечили, а после лечения 2009 г. (пустышка M2) Ранее лечили, а после 2009 г. не лечили (пустышка M4) До лечения, а также после лечения 2009 г. (пустышка M2) M5)
- Я создаю переменную с вызовом «Лечение» = 1 (0, в противном случае), когда деревня обрабатывается либо после, либо до 2009 года, либо и того, и другого.
- Я создаю переменную с вызовом «Контроль» = 1 (0, в противном случае), если деревня не обрабатывается ни после, ни до 2009 года, либо и того, и другого.
- Ключ - уникальный идентификатор деревни
- Год - переменная времени
Я запускаю следующий код, чтобы увидеть влияние на y, когда состояние деревни меняется с контроля на лечение, я запускаю следующую команду:
reghdfe y Treatment , absorb(i.key , i.year)
Это дает мне следующий вывод (здесь обрабатывается S C): Вывод 1
Это выглядит нормально, Чтобы проверить, соответствует ли направление (когда лечение становится контролем или контроль становится лечением) tter или нет: я оцениваю следующее (без кластеризованного SE):
reghdfe avg_light SC##M2 SC##M4, absorb(i.key i.year)
И я получаю следующее:
Output2
И здесь большая часть переменных и взаимодействий опущена, и я не понимаю почему. Как я могу решить эту проблему?