Несколько наблюдений на одного респондента для многочленной модели логита - PullRequest
0 голосов
/ 08 февраля 2019

Мой набор данных выглядит следующим образом:

sex age age_group district obj 1 obj 2 obj 3
   1   39      30-44     5     0     1     0
   0   40      30-44    24     0     0     1
   1   50      45-64    12     1     0     0
   1   39      30-44    11     0     0     0
   1   30      30-44    14     0     1     0
   1   33      30-44    26     0     0     0

Респондентам было предложено выбрать до трех целей политики по своему выбору из 18 (для краткости я поставил только 3 цели).Я хочу проверить, зависит ли их выбор от возраста и района.Я знаю, что модель со смешанным логитом была бы подходящей, но уловка в том, что у меня есть 18 зависимых переменных, где, возможно, вступают в действие групповые эффекты (две или более цели, выбранные вместе, потому что они казались одинаковыми для респондента).Я спросил о статистике (https://stats.stackexchange.com/questions/389005/multiple-answer-survey-building-a-regression-model) и полагаю, что мне следует перекодировать мои цели в три отдельные переменные, считая их независимыми, то есть из трех отдельных раундов вопросов. Я полагаю, что желаемый ввод данных должен выглядеть следующим образомгде choice_no - произвольно назначенный номер выбора, и все три строки относятся к одному респонденту:

sex age age_group district choice choice_no
1   39      30-44     5      obj4     1    
1   39      30-44     5      obj7     2
1   39      30-44     5      obj16    3

Столбцы choice_no не содержат ранжированных предпочтений, они будут назначаться случайным образом(самый верхний выбор в опросном листе идет к первому ряду и т. д.) Правильно ли мое мышление? Если да, как я могу добиться этого в R?

Заранее спасибо, Питер

...