Чтобы идентифицировать важные переменные в наборе данных, я начну с создания одномерной модели логистической регрессии для каждой из переменных. Однако для некоторых категориальных переменных в некоторых категориях имеется всего несколько наблюдений (общее количество наблюдений составляет 1155; пропущенные значения отсутствуют). Запуск кода
modelspec1='Y ~ X';
B1 = fitglm(table,modelspec1,'Distribution','binomial');
возвращает ошибку
Warning: Iteration limit reached.
In glmfit (line 324)
In GeneralizedLinearModel/fitter (line 575)
In classreg.regr.FitObject/doFit (line 94)
In GeneralizedLinearModel.fit (line 882)
In fitglm (line 142)
и оценка бета становится около 100, с огромной стандартной ошибкой и значением p, близким к 1. Я попытался увеличить число итераций, используя
opts = statset('glmfit');
opts.MaxIter = 10000; % default value for glmfit is 100.
но это не помогло. Мне действительно нужно получить какую-то оценку (просто отказаться от категории, к сожалению, не вариант). Как я могу решить проблему?