Я бы хотел использовать модель с фиксированным эффектом *1001* Регрессии Пуассона *, чтобы проверить, может ли использование двух разных схем (указанных в моей модели как макеты) привести к увеличению нагрузки.
У меня есть продольные данные за промежуток времени в 3 года (данные измеряются ежемесячно), с N = 100 000 + (каждый идентификатор отслеживает различное количество наблюдений / месяцев). Идентификаторы могут быть включены в две разные схемы в любой момент, они могут выбрать только одну (Схема 1) или ни одну, либо обе, либо одновременно, либо в разные моменты времени (Схема 1, а затем Схема 2).
Я хотел бы включить отдельные фиксированные эффекты (используя внутри-индивидуальные вариации в выборе двух разных схем).
Я также хочу включить фиксированные эффекты месяца / года, чтобы контролировать временные тренды / сезонность в моделях упражнений. Для этого я подумываю об использовании набора фиктивных переменных для каждого конкретного месяца в данном году.
Я бы хотел указать свою модель следующим образом:
y (i, my) = Λ (i) + γ (my) + βScheme1 (i, my) + βScheme2 (i, my) + ε (i, my)
То есть y (i, my) относится к зависимому переменному уровню упражнений, выполняемых ID i в месяце m в году y.
Λ (i) - индивидуальный фиксированный эффект.
γ (my) - время с фиксированным эффектом.
Схема 1 и Схема 2 соответственно принимают значение 1, если ENT i выбрал схему в и после месяца m.
К вашему сведению: извините, мне пришлось указать, что каждая переменная определяется в скобках в приведенном выше уравнении
Ниже приведено то, что я изначально запустил, используя функцию glm()
, включающую схемы 1 и 2 в качестве зависимых переменных, и это работало нормально.
PoissonModel <- glm(DepVar ~ Scheme1 + Scheme2, family = poisson, data = dataset)
Моя проблема в том, что я не уверен, как написать код / что делать, чтобы включить Λ (i) и γ (мой) в мою регрессию. Любая помощь будет оценена, спасибо!