В настоящее время я работаю над набором данных, состоящим из 100 значений для 4 предикторов, каждый из которых содержит 100 значений двоичных результатов (принимая значения 0 и 1).
- Я хочу определить, какой предиктор является хорошим (значимым и влиятельным) с помощью логистической регрессии?
- Я хочу проверить, дает ли мне комбинация предикторов для лучшего прогнозирования бинарного исхода?
- Как рассчитать значение информационного критерия Акаике для различных комбинаций предикторов в MATLAB?
У меня есть базовые знания о логистической регрессии, и я также был бы очень признателен за скелет кода для MATLAB, который может помочь в решении моих вышеупомянутых вопросов.
Я уже пробовал использовать в MATLAB такие функции, как glmfit и stepwiseglm.
X = ([Predictor_input(:,1:5)]); % 5 Predictors
Y = ([Binary_outcome(:,1)]); % Binary outcome
% Using glmfit getting only one model outcome:
% Determination of model coefficients and stats:
[b, dev, stats] = glmfit(X,Y,'binomial','link','logit'); %none
[PHat, LowerCIWidth, UpperCIWidth] = glmval(b,X,'logit',stats);
% Using stepviseglm:
stepwiseglm(X,Y,'constant','upper','linear','distr','binomial','Criterion','aic','Verbose',2)
Используя stepwiseglm
, я ожидал, что он попробует разные комбинации предикторов и выведет наилучшую комбинацию, но, похоже, он оценивает индивидуально (не все комбинации).