Ошибка дерева решений в Trafo и уровень в факторах - PullRequest
0 голосов
/ 20 сентября 2018

У меня есть этот код:

mydata= read.csv("/home/file.csv",stringsAsFactors=F)

sapply(mydata, class)
       chr        start         stop       strand   num_probes segment_mean     is_nocnv 

Это возвращение:

"character"    "integer"    "integer"  "character"    "integer"    "numeric"  "character"

Я создаю дерево решений:

set.seed(1234)
ind <- sample(2,nrow(mydata),replace=TRUE, prob= c(0.7,0.3))
trainData <- mydata[ind==1,]
testData <- mydata[ind==2,]


myFormula <- is_nocnv ~ chr + start + stop + strand + num_probes + segment_mean
albero <- ctree(myFormula, data=trainData)

table(predict(albero),trainData$is_nocnv)

И я получаю свою первую ошибку:

Error in trafo(data = data, numeric_trafo = numeric_trafo, factor_trafo = factor_trafo,  : 
  data class “character” is not supported

Тогда есть этот код:

chr1 <- as.character("chr19")
start1 <- as.integer(284018)
stop1 <- as.integer(58878226)
strand1 <- as.character("*")
num_probes1 <- as.integer(23929)
segment_mean1 <- as.numeric(-0.0142)
testData <- data.frame(chr=chr1,start=start1,stop=stop1,strand=strand1,num_probes=num_probes1,segment_mean=segment_mean1,is_nocnv=as.character(""))

testPred <- predict(albero,newdata= testData)
table(testPred,testData$is_nocnv)

Здесь я получаю свою вторую ошибку:

Error in checkData(oldData, RET) : 
Levels in factors of new data do not match original data

и

Error in table(testPred, testData$is_nocnv) : 
  all arguments must have the same length
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...