Обратите внимание, что здесь мы обсуждаем синтаксис, а не "доброту" модели, для такого рода вопроса вы должны обратиться к https://stats.stackexchange.com/.
Давайте использовать это уравнение в качестве примера:
.
Как правильно указано,
являются на самом деле в уравнении, это всего лишь пример.
Здесь:
Почему эндогенные являются проблематичными?Поскольку они связаны с ошибкой
, это вызывает проблемы с классической оценкой OLS.
являются инструментами, поскольку они имеют некоторые фундаментальные свойства(больше здесь ):
- Независимо от срока ошибки;
- Не влияет
задано
поддерживается постоянной; - Коррелируется с
.
В предлагаемом синтаксисе мы имеем:
x
, экзогенно, соответствует
(не проблематично); y1
, эндогенно, соответствует
(проблематично); x2
, полный набор инструментов, соответствующий
.
В приведенном вами примере x2
имеет некоторые общие переменные сx
, который представляет собой набор экзогенных переменных (не проблематично), плюс еще два инструмента.
Модель использует 3 экзогенные переменные в качестве инструментов, плюс еще две переменные.
Я не понимаю разницу между x и x2
x2
- это инструменты, которые могут или не могут перекрываться с набором экзогенных переменных (x
).
, если x2 - полный набор инструментов, почему он не включаеттакже и эндогенные переменные y1?
Это не должно включать эндогенные переменные, потому что это те, которые нужно учитывать уравнению при использовании инструментов.
Пример:
Вы хотите построить модель, которая будет предсказывать, будет ли работать женщина в семье с двумя родителями.У вас есть эти переменные:
fem_works
, ответ или зависимая переменная; fem_edu
, уровень образования женщины, экзогенный; kids
, количество детей в паре, экзогенный; other_income
, доход домохозяйства, эндогенный (вы знаете это как предварительные знания); male_edu
, образованиеуровень человека, инструмент (вы выбираете это).
При ivprobit
это будет:
mod <- ivprobit(fem_works ~ fem_edu + kids | other_income | fem_edu + kids + male_edu, data)
other_income
проблематично для модели, потому что выподозреваете, что это коррелирует с термином ошибки (другие шоки могут повлиять как на fem_works
, так и other_income
), вы решаете использовать male_edu
в качестве инструмента, чтобы "облегчить" эту проблему.(Пример взят из здесь )