Достигнут предел итерации (слишком мало наблюдений в категории?) - PullRequest
0 голосов
/ 17 мая 2018

Чтобы идентифицировать важные переменные в наборе данных, я начну с создания одномерной модели логистической регрессии для каждой из переменных. Однако для некоторых категориальных переменных в некоторых категориях имеется всего несколько наблюдений (общее количество наблюдений составляет 1155; пропущенные значения отсутствуют). Запуск кода

modelspec1='Y ~ X';
B1 = fitglm(table,modelspec1,'Distribution','binomial');

возвращает ошибку

Warning: Iteration limit reached. 
In glmfit (line 324)
In GeneralizedLinearModel/fitter (line 575)
In classreg.regr.FitObject/doFit (line 94)
In GeneralizedLinearModel.fit (line 882)
In fitglm (line 142) 

и оценка бета становится около 100, с огромной стандартной ошибкой и значением p, близким к 1. Я попытался увеличить число итераций, используя

opts = statset('glmfit');
opts.MaxIter = 10000; % default value for glmfit is 100.

но это не помогло. Мне действительно нужно получить какую-то оценку (просто отказаться от категории, к сожалению, не вариант). Как я могу решить проблему?

...