Ложноположительный показатель разницы в средствах - PullRequest
0 голосов
/ 10 октября 2019

Я пытался использовать следующий код для оценки ложноположительного показателя разницы в оценке средних значений.

sm_n <- 10
dat <- data.frame(b=rep(c("a","b"),c(4,6)),
            x = c(0,1,0,0,0,1,0,0,1,1),
            nb=rep(c(4,6),c(4,6)))
dat$y0 <- 1000*dat$x+c(0,0,0,0,1,2,3,400,5000,60000)
## summary(lm(y0~x,data=dat))$r.squared
## dat$Z <-  ifelse(dat$b=="a",complete_ra(N=4), complete_ra(N=6,m=2))
set.seed(12345)
dat$Z  <- block_ra(blocks = dat$b, block_m = c(2,2))
dat$tau <- c(2500,0,2500,0,25000,25000,0,0,0,50000)
dat$y1 <- dat$y0 + dat$tau
trueATE <- with(dat,mean(y1-y0))
trueRankATE <- with(dat,mean(rank(y1)-rank(y0)))
dat$Y <- with(dat,Z*y1 + (1-Z)*y0)
dat$ZF <- factor(dat$Z)
dat %<>% group_by(b) %>% mutate(pi=mean(Z), #prob treated
                  nbwt=Z/pi + (1-Z)/(1-pi))

Оценка сама по себе работает нормально, как и функция, которая генерирует новыйслучайное назначение без систематической связи между Z и чем-либо еще. Однако, когда я пытаюсь запустить функцию для извлечения p-values, я получаю следующую ошибку:

Ошибка в совпадении (x, table, nomatch = 0L): для «match» требуются аргументы вектора

Проблема, кажется, возникает в difference_in_means(Y~newexp(b), blocks=b,data=dat)

est3 <- difference_in_means(Y~Z,blocks=b,data=dat)

summary(est3) 

newexp <- function(b){
    ## A new random assignment with no systematic relationship between Z and anything else
    Z <- block_ra(blocks = dat$b, block_m = c(2,2))
    return(Z)
}

get_p_val_from_difference_in_means<-function(){
    ## First, shuffle to break the relationship, to make the truth zero
    ## Then, test
    theest <- difference_in_means(Y~newexp(b), blocks=b,data=dat)
    thep <-  coef(summary(theest))[1,4]
    thep
}

est3ps <- replicate(1000, get_p_val_from_difference_in_means())

mean(est3ps < .05)
plot(ecdf(est3ps ), ylim = c(0,1), xlim = c(0,1))
abline(0,1)
...