Расчет логарифмического правдоподобия на отдельном тестовом наборе - PullRequest
0 голосов
/ 29 октября 2018

Я ищу "хак" в R, который позволил бы мне рассчитать логарифмическую вероятность соответствия GLM на отдельном тестовом наборе без необходимости переписывать логарифмическую функцию правдоподобия для всех различных распределений и так далее.

Вероятность записи в журнале обучения, например, получается следующим образом:

 x_train <- rnorm(1000, mean=100)
 y_train <- rnorm(1000, mean=100)
 mdl <- glm(y_train ~ x_train, family=Gamma(link="log"))
 loglik_train <- logLik(mdl) 

Если у меня есть тестовые данные, как быстро рассчитать логарифмическую вероятность наблюдения этих новых точек данных с учетом модели, оцененной по обучающему набору?

Возможно, я подумал над тем, чтобы установить второй GLM на тестовом наборе, перезаписать оценочные коэффициенты коэффициентами исходной модели и затем запустить logLik (), но я не уверен в этом подходе.

У кого-нибудь есть предложения?

Я хотел бы избежать выполнения полного расчета (составления прогнозов, расчета вероятности каждого прогноза (с учетом специфики функции связи и т. Д.), А затем суммирования ..

Большое спасибо за любые предложения!

...