При импорте данных Excel и подготовке фрейма данных после шага добавляются каким-то образом нежелательные строки, когда я советую R опустить столбцы, удовлетворяющие определенному условию.
У меня должно быть 36 строк, но в итоге я получаюс 36 строками с данными, а затем 210 строками с данными NA по всем столбцам.Конечно, их там быть не должно, поскольку мои исходные данные не содержат никакой информации в этих строках, а на промежуточном этапе в R фрейм данных имеет всего 36 строк.
Воткод:
setwd("C:/Users/John/Desktop/School/Afstudeer/Data/Results")
x<-c("permute", "vegan", "xlsx")
lapply(x, require, character.only = TRUE)
sampSet <- read.xlsx2('Taxa_Counts_R_TRANSPOSED.xlsx', 1, endRow=37,
as.data.frame=TRUE, header=TRUE, colClasses= NA)
sampSetO<-sampSet[complete.cases(sampSet),]
row.names(sampSetO) <- sampSetO$Location
sampSetO[1] <- NULL
sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]
View(sampSet)
View(sampSetO)
View(sampSetOK)
Итак, sampSetO выглядит хорошо.sampSetOK это беспорядок.Вполне естественно думать, что в этой строке что-то идет не так:
"sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]"
Это sampSetO:

Вот что я получаю для sampSetOK (обратите внимание на количество записей):

Я сделал аналогичную строку, где у меня были rowSums вместо colSums, и это прекрасно работает....
Так в чем может быть проблема и как ее избежать?