Совокупные данные: полиномиальная логистическая регрессия - PullRequest
0 голосов
/ 03 марта 2019

Извинения. У меня есть фрейм данных, в соответствии с которым в техническом плане у меня более 800 000 пассажиров, путешествующих по 5 аэропортам для определенной маршрутизации.В идеале мне нужно провести многочленную логистическую регрессию, поскольку аэропорты - это неупорядоченный выбор.

Теоретически это означало бы 800 000 наблюдений, но вывод данных уже агрегирован в соответствии с этими 5 аэропортами.

Например,

  • Аэропорт / чел: A / 50k, B / 100k, c / 200K, D / 300K, E / 150K.

Моя первая многорежимная регрессия logit с использованием этих независимых переменных не закончилась хорошо.Поскольку R видит только эти 5 рядов аэропортов вместо потока pax, который указан отдельно под потоком pax.Это привело к очень интересным результатам, которые явно неверны.

Не уверен, как решить эту проблему, и был бы чрезвычайно благодарен за помощь.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...