Я запускаю модель отбора образцов (двухэтапную) Хекмана для моделирования участия фермера (и интенсивности участия) в некоторых схемах сохранения, используя команду 'heckit' из пакета 'sampleSelection'.
Для сравнения, я также смоделировал первый шаг как Пробит, так как, насколько я понимаю, он должен дать идентичные результаты для первой стадии Хекита. Оценки действительно идентичны, но стандартных ошибок нет (хотя они довольно близки). В приведенном ниже примере это не имеет большого значения, но в моем конкретном случае это влияет на уровни значимости, поэтому я хотел бы понять, откуда берется эта разница. У кого-нибудь есть идея?
Вот пример:
library(sampleSelection)
data("Mroz87", package = "sampleSelection")
heck1 = heckit( lfp ~ age + I( age^2 ) + kids5 + huswage + educ,
log(wage) ~ educ + exper + I( exper^2 ) + city, data=Mroz87)
prob1 <- glm(lfp ~ age + I( age^2 ) + kids5 + huswage + educ,
family=binomial(link='probit'), data=Mroz87)
summary(prob1)
summary(heck1)
SE почти, но не полностью идентичны:
Probit coefficients:
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.6204200 1.5062525 -0.412 0.680415
age 0.0100365 0.0685764 0.146 0.883641
I(age^2) -0.0004891 0.0007796 -0.627 0.530364
kids5 -0.8546564 0.1156353 -7.391 1.46e-13 ***
huswage -0.0421711 0.0122853 -3.433 0.000598 ***
educ 0.1476737 0.0235001 6.284 3.30e-10 ***
Heckit coefficients:
Probit selection equation:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.6204199 1.5164452 -0.409 0.682564
age 0.0100365 0.0689931 0.145 0.884378
I(age^2) -0.0004891 0.0007841 -0.624 0.532954
kids5 -0.8546564 0.1153682 -7.408 3.5e-13 ***
huswage -0.0421711 0.0124158 -3.397 0.000719 ***
educ 0.1476737 0.0234280 6.303 5.0e-10 ***
Outcome equation:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -0.5471531 0.2890638 -1.893 0.05877 .
educ 0.1064521 0.0171745 6.198 9.48e-10 ***
exper 0.0411569 0.0131805 3.123 0.00186 **
I(exper^2) -0.0008014 0.0003950 -2.029 0.04282 *
city 0.0532725 0.0687956 0.774 0.43897