Я хотел вычислить доверительные интервалы прогнозирования вокруг прогнозов по 0 и 1 завышенной бета-регрессии.Я думаю, что лучший способ решения этой проблемы будет с помощью начальной загрузки.Пакет, который я использую, чтобы соответствовать моей модели, gamlss в r.Чтобы получить доверительные интервалы для прогнозирования начальной загрузки, я выполняю следующую процедуру:
- Создание n независимых копий моего тренировочного набора путем выборки с заменой из него
- Подгонка бета-надутой моделик n независимым копиям моего обучающего набора
- Использование набора тестов для получения предсказанных переменных моей переменной ответа
- Повторная выборка с заменой из остатков предсказаний каждого соответствия, сгенерированных на шаге 2, идобавление их к моим прогнозируемым значениям, сгенерированным на шаге 3
- Наконец, получите квантили для распределения вокруг каждого прогнозируемого значения
Это обычная процедура, которую я бы использовал в стандартной модели линейной регрессиии из того, что я собрал, это все равно должно быть применимо к тому, что я пытаюсь сделать с завышенной бета-регрессией.
Мой вопрос состоит в том, какой тип остатков я должен пересчитать, было бы более подходящим для повторной выборки вэтот случай.Чтобы оценить производительность модели, я видел, что люди используют квантильные остатки, но я не уверен, каким будет влияние использования таких преобразованных остатков, и если это уместно в этом случае.
Был бы очень признателен за помощь, если кто-тов прошлом уже проводил подобное упражнение и, что более важно, руководство, чтобы понять, какой будет правильный тип ошибок, которые будут использоваться в этом случае, и последствия использования других типов ошибок (скажем, Пирсона, отклонение, изучение) ...
Спасибо