Я занимаюсь исследованием метода классификации Лассо. У меня есть набор данных 40x15, и я хочу разработать биномиальное уравнение без разделения данных на поезд и набор тестов (из-за небольшого размера выборки).
Мне нужны конкретные сведения о том, как именно Matlab выполняет LASSO ( lassoglm ). Я знаю общую концепцию того, как это работает в отношении удаления незначительных терминов путем применения штрафного члена к коэффициентам, я также знаю о CV и о том, как он берет подмножество данных и выполняет анализ этого подмножества, но у меня все еще есть какой-то конкретный вопрос о процессе LASSO в Matlab.
Я хочу знать:
- в случае, если вы не используете CV , а просто делаете B = lassoglm (X, Y) , каковы значения B ? Это матрица из X коэффициентов, которую я могу использовать для биномиального уравнения?
- могу ли я по-прежнему иметь возможность извлекать Index1SE и IndexMinDeviance , чтобы иметь наиболее важные термины, способствующие моей модели, без использования CV ?
- при CV находит оптимальное значение для лямбды, когда я, например, использую CV = 10 , как Matlab выполняет лассо ( lambda = 100 * 1035) *)? Выполняет ли Matlab разный анализ для каждого значения лямбды? Если так, КАК ? и HOW он строит график Lambda-Deviance , имеющий различные полосы ошибок ?
- и, наконец, могу ли я просто проигнорировать CV и выполнить простую классификацию Лассоглма, но все же найти лучшие, значимые термины из моих 15 терминов, а затем сформировать биномиальную формулировку (имеющую Intercept, C и X коэффициенты)