Я перепробовал все возможные решения в переполнении стека, предложенные для данных и ссылок, должны быть факторы с одинаковыми уровнями.
set.seed(10)
indices = sample.split(consumers$label, SplitRatio = 0.75)
train = consumers[indices,]
test = consumers[!(indices),]
##Build a logistic regression model
is.factor(train$label)
contrasts(train$label)
lr_model <- data.frame(label = as.numeric(rnorm(100)>0.5), b= rnorm(100), c = rnorm(100), d = rnorm(100))
logitMod <- glm(label ~ ., data=train, family=binomial(link="logit"))
pdata <- predict(logitMod, newdata = train, type = "response")
confusionMatrix(data = as.numeric(pdata>0.5), reference = train$label)
Я все еще получаю "Ошибка: data
и reference
должны быть факторамис теми же уровнями. "
В моем наборе данных есть три столбца - рацион, время и метка (где метка мужская и женская)