Я ищу "хак" в R, который позволил бы мне рассчитать логарифмическую вероятность соответствия GLM на отдельном тестовом наборе без необходимости переписывать логарифмическую функцию правдоподобия для всех различных распределений и так далее.
Вероятность записи в журнале обучения, например, получается следующим образом:
x_train <- rnorm(1000, mean=100)
y_train <- rnorm(1000, mean=100)
mdl <- glm(y_train ~ x_train, family=Gamma(link="log"))
loglik_train <- logLik(mdl)
Если у меня есть тестовые данные, как быстро рассчитать логарифмическую вероятность наблюдения этих новых точек данных с учетом модели, оцененной по обучающему набору?
Возможно, я подумал над тем, чтобы установить второй GLM на тестовом наборе, перезаписать оценочные коэффициенты коэффициентами исходной модели и затем запустить logLik (), но я не уверен в этом подходе.
У кого-нибудь есть предложения?
Я хотел бы избежать выполнения полного расчета (составления прогнозов, расчета вероятности каждого прогноза (с учетом специфики функции связи и т. Д.), А затем суммирования ..
Большое спасибо за любые предложения!