Я немного поигрался с функцией regsubsets , используя метод "forward" для выбора переменных для модели линейной регрессии. Однако, несмотря на то, что я также читаю документацию, я не могу понять, как leaps.setup, лежащий в основе этой функции, определяет «лучшую» модель для каждого отдельного числа переменных в модели.
Скажем, у меня есть модель с потенциальными 10 переменными (и nvmax = 10), я получаю ровно одну "лучшую" модель для модели с 1 переменным, 2 переменными и c. Но как эта модель выбирается функцией? Мне особенно интересно, потому что после запуска этой функции я могу извлечь лучшую модель из всех моделей с разными (!) Размерами определяя определенный c критерий (например, adjr2).
В связи с этим мне интересно: если я установлю, например, nbest = 5, я понимаю, что функция вычисляет пять лучших моделей для каждой модели. размер (т. е. для модели с десятью переменными она дает пять различных вариантов, которые работают лучше, чем остальные). Если я правильно понимаю, есть ли способ извлечь эти пять моделей для определенного c размера модели? То есть, например, отобразить коэффициенты этих пяти лучших моделей ?
Надеюсь, я проясняю свои проблемы здесь ... Пожалуйста, дайте мне знать, если примерные данные или какая-либо дополнительная информация поможет прояснить проблему!