GLM: как вы можете вычислить logLik на новых данных? - PullRequest
1 голос
/ 21 октября 2019

Я применил логистическую регрессию, используя glm в R следующим образом:

 model <- glm(y ~ x, family=binomial(link='logit'), data=training_data)

Теперь я хочу вычислить логарифмическую вероятность наблюдения моих тестовых данных, заданных model, чтобы я мог видетьесли он работает лучше, чем другие модели.

logLik вычисляет логарифмическую вероятность наблюдения обучающих данных для данной модели - это именно тот параметр, который был максимизирован во время подгонки модели. Но как я могу получить логарифмическую вероятность наблюдения тестовых данных для данной модели?

1 Ответ

0 голосов
/ 21 октября 2019
prob=predict(model, newdata=..., type="response")

Если вы сделаете: ?predict.glm, вы сможете увидеть, как указать аргумент типа для соответствующих значений.

И, благодаря комментарию Бена Болкера, - завершить ответ: sum(log(prob*resp + (1-prob)*(1-resp))).

...