Прошу прощения за вопрос здесь, но на сайте нет страницы для обсуждения этого курса, и в нем упоминается stackoverflow, чтобы задать любые вопросы. Это из этого курса edx .
Q1: Использование следующего набора данных:
'''
url <- "https://raw.githubusercontent.com/genomicsclass/dagdata/master/inst/extdata/babies.txt"
filename <- basename(url)
download(url, destfile=filename)
babies <- read.table("babies.txt", header=TRUE)
'''
, разбитого на две группы (для некурящих и курящих):
bwt.nonsmoke <- filter(babies, smoke==0) %>% select(bwt) %>% unlist
bwt.smoke <- filter(babies, smoke==1) %>% select(bwt) %>% unlist
Установите семена на 1 и получите образцы от некурящих матерей (дат. Нс) размером N = 25. Затем, не сбрасывая семена, возьмите образец того же размера от курящих матерей (дат.с). Вычислите t-statisti c (назовите его tval).
Каково абсолютное значение t-statisti c?
Вот как я это сделал:
set.seed(1)
dat.ns <- sample(bwt.nonsmoke,25)
dat.s <- sample(bwt.smoke,25)
tval <- t.test(dat.ns,dat.s)$statistic
tval
Это дает значение 2.120904, которое, по-видимому, неверно. Я также попытался установить начальное значение 1 перед каждым образцом следующим образом:
set.seed(1)
dat.ns <- sample(bwt.nonsmoke,25)
set.seed(1)
dat.s <- sample(bwt.smoke,25)
tval <- t.test(dat.ns,dat.s)$statistic
tval
, что дает значение t 1,573627, что также неверно. Я не уверен, что делаю неправильно, и мне нужна помощь.