В настоящее время я работаю над расчетом интервалов прогнозирования, полученных путем квантильной регрессии, с помощью H2o DeepLearning и GradientBoosting. В H2o вы должны строить и обучать отдельные модели для каждого интервала, например ::10000
Для интервала прогнозирования 95% вам потребуется отдельная модель для нижней границы (100-95)/2)=2.5%
и верхней границы (100 - (100-95)/2)=97.5%
.
Сейчас я пытаюсь оптимизировать параметр модели с помощью Grid-Search. Какой будет лучший подход?
Запуск Grid-Search для одной из моделей и использование параметров лучшей модели сетки для всех моделей.
Или запустить отдельную сетку для каждой модели и получить в итоге две модели с разными параметрами?
Меня беспокоит то, что во втором варианте весь интервал будет непоследовательным, поскольку две модели больше не сопоставимы.
Кто-нибудь сталкивался с этим?