Как именно Matlab выполняет классификацию Лассо? - PullRequest
1 голос
/ 13 марта 2019

Я занимаюсь исследованием метода классификации Лассо. У меня есть набор данных 40x15, и я хочу разработать биномиальное уравнение без разделения данных на поезд и набор тестов (из-за небольшого размера выборки).

Мне нужны конкретные сведения о том, как именно Matlab выполняет LASSO ( lassoglm ). Я знаю общую концепцию того, как это работает в отношении удаления незначительных терминов путем применения штрафного члена к коэффициентам, я также знаю о CV и о том, как он берет подмножество данных и выполняет анализ этого подмножества, но у меня все еще есть какой-то конкретный вопрос о процессе LASSO в Matlab.

Я хочу знать:

  • в случае, если вы не используете CV , а просто делаете B = lassoglm (X, Y) , каковы значения B ? Это матрица из X коэффициентов, которую я могу использовать для биномиального уравнения?
  • могу ли я по-прежнему иметь возможность извлекать Index1SE и IndexMinDeviance , чтобы иметь наиболее важные термины, способствующие моей модели, без использования CV ?
  • при CV находит оптимальное значение для лямбды, когда я, например, использую CV = 10 , как Matlab выполняет лассо ( lambda = 100 * 1035) *)? Выполняет ли Matlab разный анализ для каждого значения лямбды? Если так, КАК ? и HOW он строит график Lambda-Deviance , имеющий различные полосы ошибок ?
  • и, наконец, могу ли я просто проигнорировать CV и выполнить простую классификацию Лассоглма, но все же найти лучшие, значимые термины из моих 15 терминов, а затем сформировать биномиальную формулировку (имеющую Intercept, C и X коэффициенты)
...