Как исправить ошибку «Ошибка в возврате if (empty (.data)) (.data): пропущенное значение, где требуется TRUE / FALSE» в SummarySE - PullRequest
0 голосов
/ 09 июля 2019

Я хочу добавить стандартные полосы ошибок к графику средств, которые я сделал.Для этого я нашел код summarySE в кулинарной книге R и загрузил его.Первым признаком проблемы было то, что я продолжал получать знак «+» в начале каждой строки, когда пытался запустить код, но последняя строка была пустой и имела «>», поэтому я решил, что все в порядке.

Затем, когда я пытался запустить свой собственный код, я получаю сообщение об ошибке:

Error in if (empty(.data)) return(.data) : 
 missing value where TRUE/FALSE needed

Вот что я получил из поваренной книги:

summarySE <- function(data=NULL, measurevar, groupvars=NULL, na.rm=FALSE,
                      conf.interval=.95, .drop=TRUE) {
  library(plyr)

  # New version of length which can handle NA's: if na.rm==T, don't count them
  length2 <- function (x, na.rm=FALSE) {
    if (na.rm) sum(!is.na(x))
    else       length(x)
  }

  # This does the summary. For each group's data frame, return a vector with
  # N, mean, and sd
  datac <- ddply(data, groupvars, .drop=.drop,
                 .fun = function(xx, col) {
                   c(N    = length2(xx[[col]], na.rm=na.rm),
                     mean = mean   (xx[[col]], na.rm=na.rm),
                     sd   = sd     (xx[[col]], na.rm=na.rm)
                   )
                 },
                 measurevar
  )

  # Rename the "mean" column    
  datac <- rename(datac, c("mean" = measurevar))

  datac$se <- datac$sd / sqrt(datac$N)  # Calculate standard error of the mean

  # Confidence interval multiplier for standard error
  # Calculate t-statistic for confidence interval: 
  # e.g., if conf.interval is .95, use .975 (above/below), and use df=N-1
  ciMult <- qt(conf.interval/2 + .5, datac$N-1)
  datac$ci <- datac$se * ciMult

  return(datac)
} 

Воткод, который я написал:

summarySE(data = "graph_AzBioQuiet_allelectrodes", measurevar = "Percent", groupvars = c("mrn", "type", "Time_BIN"), na.rm=F, conf.interval=0.95, .drop=TRUE)

Я знаю, что многие пользователи не ставили "" вокруг имени данных, как я, но когда я не ставил кавычки вокруг имениданные, я получил другое сообщение об ошибке, в котором говорилось, что «все аргументы должны быть названы».Кавычки покончили с этим сообщением об ошибке, но теперь я получаю другое, как я уже говорил.

Я не могу поделиться своими данными, поскольку они содержат конфиденциальную медицинскую информацию.По сути, я хочу получить среднее значение и SE балла пациента по медицинскому тесту, называемому «Процент», и хочу сгруппировать его по времени теста, называемого «Time_BIN», и по типу медицинского устройства, которое у них называется, «тип".У меня нет никаких пустых значений данных / NA в моей таблице, когда я загружаю в R, поэтому я очень запутался.Я не могу понять, почему я продолжаю получать это сообщение об ошибке.

Пожалуйста, сообщите.

Я ожидал график, подобный показанному в кулинарной книге, но я получил это сообщение об ошибке:

Error in if (empty(.data)) return(.data) : 
 missing value where TRUE/FALSE needed
...