Мой набор данных выглядит следующим образом:
sex age age_group district obj 1 obj 2 obj 3
1 39 30-44 5 0 1 0
0 40 30-44 24 0 0 1
1 50 45-64 12 1 0 0
1 39 30-44 11 0 0 0
1 30 30-44 14 0 1 0
1 33 30-44 26 0 0 0
Респондентам было предложено выбрать до трех целей политики по своему выбору из 18 (для краткости я поставил только 3 цели).Я хочу проверить, зависит ли их выбор от возраста и района.Я знаю, что модель со смешанным логитом была бы подходящей, но уловка в том, что у меня есть 18 зависимых переменных, где, возможно, вступают в действие групповые эффекты (две или более цели, выбранные вместе, потому что они казались одинаковыми для респондента).Я спросил о статистике (https://stats.stackexchange.com/questions/389005/multiple-answer-survey-building-a-regression-model) и полагаю, что мне следует перекодировать мои цели в три отдельные переменные, считая их независимыми, то есть из трех отдельных раундов вопросов. Я полагаю, что желаемый ввод данных должен выглядеть следующим образомгде choice_no - произвольно назначенный номер выбора, и все три строки относятся к одному респонденту:
sex age age_group district choice choice_no
1 39 30-44 5 obj4 1
1 39 30-44 5 obj7 2
1 39 30-44 5 obj16 3
Столбцы choice_no не содержат ранжированных предпочтений, они будут назначаться случайным образом(самый верхний выбор в опросном листе идет к первому ряду и т. д.) Правильно ли мое мышление? Если да, как я могу добиться этого в R?
Заранее спасибо, Питер