Здесь много сообщений о "Perfect Separation Error"
в statsmodels при выполнении регрессии logisit c. Но я не занимаюсь регрессом. Я делаю GLM с частотными весами и гауссовым распределением. Таким образом, в основном OLS.
Все мои независимые переменные являются категориальными с большим количеством категорий. Столь большой размерный набор двоичных кодов.
Но я очень часто получаю "perfectseperationerror" от statsmodels
У меня много моделей. Я думаю, что получаю эту ошибку, когда мои данные слишком тонки для такого количества переменных. Тем не менее, с весами freq, в теории, у меня на самом деле гораздо больше возможностей, чем для данных, потому что наблюдения должны быть умножены на freq.
Есть ли какие-либо рекомендации о том, как действовать?
reg = sm.GLM(dep, Indies, freq_weights = freq)
<p>Error: class 'statsmodels.tools.sm_exceptions.PerfectSeparationError'>