Найти соответствующую комбинацию предикторов и значение информационного критерия Акаике, используя логистическую регрессию - PullRequest
0 голосов
/ 09 мая 2019

В настоящее время я работаю над набором данных, состоящим из 100 значений для 4 предикторов, каждый из которых содержит 100 значений двоичных результатов (принимая значения 0 и 1).

  1. Я хочу определить, какой предиктор является хорошим (значимым и влиятельным) с помощью логистической регрессии?
  2. Я хочу проверить, дает ли мне комбинация предикторов для лучшего прогнозирования бинарного исхода?
  3. Как рассчитать значение информационного критерия Акаике для различных комбинаций предикторов в MATLAB?

У меня есть базовые знания о логистической регрессии, и я также был бы очень признателен за скелет кода для MATLAB, который может помочь в решении моих вышеупомянутых вопросов.

Я уже пробовал использовать в MATLAB такие функции, как glmfit и stepwiseglm.

X = ([Predictor_input(:,1:5)]);   % 5 Predictors
Y = ([Binary_outcome(:,1)]); % Binary outcome

% Using glmfit getting only one model outcome:
% Determination of model coefficients and stats:
[b, dev, stats] = glmfit(X,Y,'binomial','link','logit'); %none
[PHat, LowerCIWidth, UpperCIWidth] = glmval(b,X,'logit',stats);

% Using stepviseglm:    
stepwiseglm(X,Y,'constant','upper','linear','distr','binomial','Criterion','aic','Verbose',2)

Используя stepwiseglm, я ожидал, что он попробует разные комбинации предикторов и выведет наилучшую комбинацию, но, похоже, он оценивает индивидуально (не все комбинации).

...