Я пытался использовать следующий код для оценки ложноположительного показателя разницы в оценке средних значений.
sm_n <- 10
dat <- data.frame(b=rep(c("a","b"),c(4,6)),
x = c(0,1,0,0,0,1,0,0,1,1),
nb=rep(c(4,6),c(4,6)))
dat$y0 <- 1000*dat$x+c(0,0,0,0,1,2,3,400,5000,60000)
## summary(lm(y0~x,data=dat))$r.squared
## dat$Z <- ifelse(dat$b=="a",complete_ra(N=4), complete_ra(N=6,m=2))
set.seed(12345)
dat$Z <- block_ra(blocks = dat$b, block_m = c(2,2))
dat$tau <- c(2500,0,2500,0,25000,25000,0,0,0,50000)
dat$y1 <- dat$y0 + dat$tau
trueATE <- with(dat,mean(y1-y0))
trueRankATE <- with(dat,mean(rank(y1)-rank(y0)))
dat$Y <- with(dat,Z*y1 + (1-Z)*y0)
dat$ZF <- factor(dat$Z)
dat %<>% group_by(b) %>% mutate(pi=mean(Z), #prob treated
nbwt=Z/pi + (1-Z)/(1-pi))
Оценка сама по себе работает нормально, как и функция, которая генерирует новыйслучайное назначение без систематической связи между Z
и чем-либо еще. Однако, когда я пытаюсь запустить функцию для извлечения p-values
, я получаю следующую ошибку:
Ошибка в совпадении (x, table, nomatch = 0L): для «match» требуются аргументы вектора
Проблема, кажется, возникает в difference_in_means(Y~newexp(b), blocks=b,data=dat)
est3 <- difference_in_means(Y~Z,blocks=b,data=dat)
summary(est3)
newexp <- function(b){
## A new random assignment with no systematic relationship between Z and anything else
Z <- block_ra(blocks = dat$b, block_m = c(2,2))
return(Z)
}
get_p_val_from_difference_in_means<-function(){
## First, shuffle to break the relationship, to make the truth zero
## Then, test
theest <- difference_in_means(Y~newexp(b), blocks=b,data=dat)
thep <- coef(summary(theest))[1,4]
thep
}
est3ps <- replicate(1000, get_p_val_from_difference_in_means())
mean(est3ps < .05)
plot(ecdf(est3ps ), ylim = c(0,1), xlim = c(0,1))
abline(0,1)