Я пытаюсь выполнить загрузку, используя R, используя 2 метода. Один метод - это ручной подход, а другой - использование загрузочного пакета.
Моя проблема в том, что я получаю немного другие результаты. Я хочу знать, связано ли это с чем-то неправильным в моем ручном подходе.
Набор данных: https://drive.google.com/open?id=1bSNKGpSEJqmSozQz88d158mchBO45Mje
Мой код выглядит следующим образом,
data1 <- read.table("CH11TA10.txt", quote="\"", comment.char="",col.names = c("X","Y"))
set.seed(1) #sampling from 2 or more columns simultenouly
require(dplyr)
lst <- replicate(
5,
df.smpl <- data1 %>% sample_n(length(data1$Y), replace = T),
simplify = FALSE)
bets <- lapply(lst, function(data2) coefficients(lm(Y ~ X, data = data2))[2])
mean(unlist(bets, use.names = T))
mean(unlist(bets, use.names = T)) -coef(lm(Y~X ,data=data1))[2]
# -0.0003327845
require(boot)
fit.reg <- function(data, index) {
result <- coef(lm(Y ~ X , data = data, subset = index))
return(result)
}
n <- nrow(data1)
set.seed(1)
reg.boot <- boot(data1, fit.reg, R = 5)
Call:
boot(data = data1, statistic = fit.reg, R = 5)
Bootstrap Statistics :
original bias std. error
t1* 56.1569294 0.386268071 3.26540381
t2* 0.5800308 -0.009682677 0.09946742
>
Может кто-нибудь помочь мне разобраться в проблеме?
спасибо.