У меня есть вопрос о том, как исправить смещение выбора в опыте с использованием R. В этом опыте мы оцениваем влияние незначительных изменений в формулировках на участие в веб-опросах. Например, если вы скажете людям, что большинство людей участвует, они более склонны участвовать сами? Это в конце телефонного опроса, где интервьюер спрашивает собеседника, хочет ли он участвовать в веб-опросах в будущем. Мы проверяем несколько фраз, которые интервьюер затем зачитывает интервьюируемому вслух.
У меня есть две зависимые переменные, которые я оценил: первая - говорит ли человек «да» или «нет». Во-вторых, действительно ли человек участвует в опросе, который состоится через 3-4 дня. Сначала я сделал просто два логита: сначала я оцениваю вероятность сказать «да» на основе лечения, а также несколько других социально-демографических переменных (возраст, пол, доход, обычно). Затем я оцениваю вероятность принятия, используя точно такие же пояснительные переменные.
Но мой научный руководитель сказал мне (это исследование является частью моей кандидатской диссертации по экономике), что это было неправильно, потому что оно не учитывало предвзятость выбора. Идея заключалась в том, что, поскольку люди должны сказать «да» интервьюеру, прежде чем они смогут участвовать (в противном случае их не будет в списке рассылки), вторая модель (участие) будет сильно зависеть от того, что заставляет людей говорить «да» », А не то, что заставляет их на самом деле участвовать.
В этом он немного похож на знаменитый пример Хекмана, где он пытается оценить то, что определяет заработную плату, но у него есть только данные о людях, которые работают, которые могут значительно отличаться от людей, которые этого не делают. Естественно, мой директор посоветовал мне изучить двухшаговую модель Хекмана. За исключением двух проблем: кажется, что это действительно работает, только если вторая модель имеет непрерывную зависимую переменную, где моя двоичная (они либо участвуют, либо нет). И, возможно, что еще более важно, я предполагаю, что именно те же самые переменные влияют как на участие, так и на «да». Это действительно основная часть гипотезы исследования, и я не могу ее изменить. Но я видел, что для того, чтобы исправление Хекмана действительно что-то значило, две модели должны отличаться друг от друга.
В конце концов, я действительно не знаю, что делать. Я очень плохо разбираюсь в эконометрике и статистике, и я чувствую себя немного не в своей тарелке, поэтому, если кто-то найдет время, чтобы рассказать мне, что они думают об этой ситуации, я был бы очень благодарен.
Мне действительно нужно проверять смещение выбора, или допустимо игнорировать его в моей ситуации? И если мне нужно проверить один, какой метод я мог бы использовать, учитывая, что обе мои модели имеют двоичную зависимую переменную и точно такие же объясняющие переменные? Как я могу сделать это в R?
Спасибо, что уделили время!