Нежелательные строки добавлены в фрейм данных - PullRequest
1 голос
/ 22 апреля 2019

При импорте данных Excel и подготовке фрейма данных после шага добавляются каким-то образом нежелательные строки, когда я советую R опустить столбцы, удовлетворяющие определенному условию.

У меня должно быть 36 строк, но в итоге я получаюс 36 строками с данными, а затем 210 строками с данными NA по всем столбцам.Конечно, их там быть не должно, поскольку мои исходные данные не содержат никакой информации в этих строках, а на промежуточном этапе в R фрейм данных имеет всего 36 строк.

Воткод:

setwd("C:/Users/John/Desktop/School/Afstudeer/Data/Results")

x<-c("permute", "vegan", "xlsx")

lapply(x, require, character.only = TRUE)

sampSet <- read.xlsx2('Taxa_Counts_R_TRANSPOSED.xlsx', 1, endRow=37, 
as.data.frame=TRUE, header=TRUE, colClasses= NA)

sampSetO<-sampSet[complete.cases(sampSet),]

row.names(sampSetO) <- sampSetO$Location
sampSetO[1] <- NULL

sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]

View(sampSet)

View(sampSetO)

View(sampSetOK)

Итак, sampSetO выглядит хорошо.sampSetOK это беспорядок.Вполне естественно думать, что в этой строке что-то идет не так:

"sampSetOK = sampSetO[colSums(sampSetO) > 0.1,]"

Это sampSetO:

sampSetO_Good

Вот что я получаю для sampSetOK (обратите внимание на количество записей):

Unwanted_Rows

Я сделал аналогичную строку, где у меня были rowSums вместо colSums, и это прекрасно работает....

Так в чем может быть проблема и как ее избежать?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...