Здравствуйте, я пытаюсь увидеть логистическую c связь между классификацией нормальных образцов и образцов рака на основе экспрессии этих 5 генов из таблицы выше . Я расположил свой набор данных так, чтобы он выглядел как таблица ниже
Я написал свой код, который показан под таблицей. Мне было интересно, почему gene1 не отображается в моей сводке результатов в регрессии logisti c. Я преобразовал гены в факторы, но ген 1 по какой-то причине не обнаруживается. Может кто-нибудь объяснить, что здесь не так?
mynewdata$genes <- as.factor(mynewdata$genes)
mynewdata$label <-as.factor(mynewdata$label)
#mynewdata$label
is.factor(mynewdata$genes)
is.factor(mynewdata$label)
set.seed(123)
training.samples <- mynewdata$label %>%
createDataPartition(p = 0.8, list = FALSE)
train.data <- mynewdata[training.samples, ]
test.data <- mynewdata[-training.samples, ]
model <- glm( label ~., data = train.data, family = binomial)
# Summarize the model
summary(model)$coef
Мои результаты выглядят так:
Я не уверен, что делаю здесь не так. «Гены 1» не отображаются по какой-то причине. Чтобы увидеть взаимосвязь между различными генами и раком и нормальными клетками, я должен просто сделать 5 отдельных столбцов в моем файле Excel с каждым геном для запуска моей логистической c регрессии?