Я хотел бы сделать некоторый остаточный анализ для GLM.
Моя модель имеет вид
using GLM
model = glm(@formula(y ~ x), data, Binomial(), LogitLink())
Мой учебник предлагает, чтобы остаточный анализ в GLM проводился с использованием остаточных отклонений. Я был рад видеть, что GLM Джулии имеет функцию devresid()
, и что она предлагает, как использовать ее для построения графиков (sign(y - μ) * sqrt(devresid(D, y, μ))
). Тем не менее, я в полной растерянности относительно того, какими должны быть входные аргументы. Глядя на строку do c:
?devresid
devresid(D, y, μ::Real)
Return the squared deviance residual of μ from y for distribution D
The deviance of a GLM can be evaluated as the sum of the squared deviance residuals. This is the principal use for these values. The actual deviance residual, say for plotting, is the signed square root of this value
sign(y - μ) * sqrt(devresid(D, y, μ))
Examples
julia> devresid(Normal(), 0, 0.25) ≈ abs2(0.25)
true
julia> devresid(Bernoulli(), 1, 0.75) ≈ -2*log(0.75)
true
julia> devresid(Bernoulli(), 0, 0.25) ≈ -2*log1p(-0.25)
true
- D: Я предполагаю, что в моем случае это
Binomial()
- y: Я предполагаю это переменная индикатора для отдельного случая, т.е. 1 или 0
- μ: что это такое?
Как я могу использовать эту функцию для создания таких вещей, как графики Остаточное отклонение по нормальной шкале вероятности и от подгоночных значений?
Вот данные, которые я использую в форме CSV
x,y
400,0
220,1
490,0
210,1
500,0
270,0
200,1
470,0
480,0
310,1
240,1
490,0
420,0
330,1
280,1
210,1
300,1
470,1
230,0
430,0
460,0
220,1
250,1
200,1
390,0