Извинения. У меня есть фрейм данных, в соответствии с которым в техническом плане у меня более 800 000 пассажиров, путешествующих по 5 аэропортам для определенной маршрутизации.В идеале мне нужно провести многочленную логистическую регрессию, поскольку аэропорты - это неупорядоченный выбор.
Теоретически это означало бы 800 000 наблюдений, но вывод данных уже агрегирован в соответствии с этими 5 аэропортами.
Например,
- Аэропорт / чел: A / 50k, B / 100k, c / 200K, D / 300K, E / 150K.
Моя первая многорежимная регрессия logit с использованием этих независимых переменных не закончилась хорошо.Поскольку R видит только эти 5 рядов аэропортов вместо потока pax, который указан отдельно под потоком pax.Это привело к очень интересным результатам, которые явно неверны.
Не уверен, как решить эту проблему, и был бы чрезвычайно благодарен за помощь.