Различные результаты для начальной загрузки с использованием различных методов с использованием R - PullRequest
0 голосов
/ 21 марта 2019

Я пытаюсь выполнить загрузку, используя R, используя 2 метода. Один метод - это ручной подход, а другой - использование загрузочного пакета. Моя проблема в том, что я получаю немного другие результаты. Я хочу знать, связано ли это с чем-то неправильным в моем ручном подходе.

Набор данных: https://drive.google.com/open?id=1bSNKGpSEJqmSozQz88d158mchBO45Mje

Мой код выглядит следующим образом,

 data1 <- read.table("CH11TA10.txt", quote="\"", comment.char="",col.names = c("X","Y"))
    set.seed(1) #sampling from 2 or more columns simultenouly 
    require(dplyr)
    lst <- replicate(
      5,
      df.smpl <- data1 %>% sample_n(length(data1$Y), replace = T),
      simplify = FALSE)
    bets <- lapply(lst, function(data2) coefficients(lm(Y ~ X, data = data2))[2])
    mean(unlist(bets, use.names = T))

    mean(unlist(bets, use.names = T)) -coef(lm(Y~X ,data=data1))[2]

    # -0.0003327845 


    require(boot)

    fit.reg <- function(data, index) {
      result <- coef(lm(Y ~ X , data = data, subset = index))
      return(result)
    }
    n <- nrow(data1)
    set.seed(1)
    reg.boot <- boot(data1, fit.reg, R = 5)




      Call:
boot(data = data1, statistic = fit.reg, R = 5)


Bootstrap Statistics :
      original       bias    std. error
t1* 56.1569294  0.386268071  3.26540381
t2*  0.5800308 -0.009682677  0.09946742
> 

Может кто-нибудь помочь мне разобраться в проблеме? спасибо.

...