SAS Pro c GlmSelect - Как получить оценки параметров с помощью перекрестной проверки - PullRequest
0 голосов
/ 28 января 2020

Я использую Pro c GlmSelect и функцию перекрестной проверки, потому что у меня довольно маленький размер выборки.

Я выбираю модель на основе самой низкой CVPRESS (прогнозируемой суммы ошибок). Выходные данные создают «окончательные» оценки параметров для всех переменных, а также оценки параметров для каждой перекрестной проверки и переменной.

Однако «окончательная» оценка параметра не эквивалентна ни среднему, ни средневзвешенному значению, где я взвешиваюсь ни по размеру набора тестов, ни по комплекту проверки.

Я просмотрел множество инструкций SAS, но не могу найти объяснения того, как окончательные оценки параметров выводятся из различных перекрестных проверок.

Буду очень благодарен за ответ или что-то, что укажет мне правильное направление.

Br,

1 Ответ

1 голос
/ 28 января 2020

Ваш вопрос на самом деле указывает скорее на природу перекрестной проверки, чем PROC GLMSELECT, я думаю. «Окончательные» оценки представляют собой , а не комбинацию оценок из моделей, которые были установлены во время перекрестной проверки - между ними нет такой взаимосвязи.

Вот почему: во время CV вы подгоняете отдельные модели к различным сгибам данных (т. Е. Каждая модель соответствует разному подмножеству данных), и оценки являются оптимальными " решение "на этих данных ( подробности здесь ). «Окончательное соответствие» оценивается по всей выборке, которую я предполагаю. Различия в данных обучения действительно приводят к различиям в оценках, но вы не можете ожидать, что «окончательные» оценки будут получены из подбора CV; просто подумайте, что подгонка выполняется с помощью нелинейной и часто сложной функции.

Мое предложение: используйте подбора CV, чтобы увидеть распределение коэффициентов; сравнить с ними окончательные оценки; и изучить производительность каждой модели CV. Это поможет вам проверить вашу модель и ее выбор.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...