Интервал доверительного прогнозирования при завышенной бета-регрессии - PullRequest
0 голосов
/ 21 февраля 2019

Я хотел вычислить доверительные интервалы прогнозирования вокруг прогнозов по 0 и 1 завышенной бета-регрессии.Я думаю, что лучший способ решения этой проблемы будет с помощью начальной загрузки.Пакет, который я использую, чтобы соответствовать моей модели, gamlss в r.Чтобы получить доверительные интервалы для прогнозирования начальной загрузки, я выполняю следующую процедуру:

  1. Создание n независимых копий моего тренировочного набора путем выборки с заменой из него
  2. Подгонка бета-надутой моделик n независимым копиям моего обучающего набора
  3. Использование набора тестов для получения предсказанных переменных моей переменной ответа
  4. Повторная выборка с заменой из остатков предсказаний каждого соответствия, сгенерированных на шаге 2, идобавление их к моим прогнозируемым значениям, сгенерированным на шаге 3
  5. Наконец, получите квантили для распределения вокруг каждого прогнозируемого значения

Это обычная процедура, которую я бы использовал в стандартной модели линейной регрессиии из того, что я собрал, это все равно должно быть применимо к тому, что я пытаюсь сделать с завышенной бета-регрессией.

Мой вопрос состоит в том, какой тип остатков я должен пересчитать, было бы более подходящим для повторной выборки вэтот случай.Чтобы оценить производительность модели, я видел, что люди используют квантильные остатки, но я не уверен, каким будет влияние использования таких преобразованных остатков, и если это уместно в этом случае.

Был бы очень признателен за помощь, если кто-тов прошлом уже проводил подобное упражнение и, что более важно, руководство, чтобы понять, какой будет правильный тип ошибок, которые будут использоваться в этом случае, и последствия использования других типов ошибок (скажем, Пирсона, отклонение, изучение) ...

Спасибо

...