Предположим, я хочу оценить добротность линейной модели до и после исключения ковариат и хочу реализовать какую-то процедуру начальной загрузки.
Я попытался загрузить сумму остатков обеих моделей изатем я применил критерий Колмогорова-Смирнова, чтобы оценить, являются ли эти два распределения одинаковыми.
Минимальный рабочий код:
lm.statistic.resid <- function(data,i){
d<-data[i,]
r.gressor <- colnames(data)[1]
c.variates <- colnames(data)[-1]
lm.boot <- lm(data=d)
out <- sum(resid(lm.boot))
return(out)
}
df.restricted <- mtcars[ , names(mtcars) != c("wt")]
classical.lm <- lm(mtcars)
restricted.lm <- lm(df.restricted)
boot.regression.full = boot(df,
statistic=lm.statistic.resid,
R=1000)
boot.regression.restricted = boot(df.restricted,
statistic=lm.statistic.resid,
R=1000)
x <- boot.regression.restricted$t
y <- boot.regression.full$t
ks.test(x,y)
Однако я получаю один и тот же результат как при удалении wt (что статистически значимо), так и am (чего нет).
В случае удаления wt .
следует ожидать меньшего значения p.