Logisti c Функция и определение категориальных переменных? - PullRequest
0 голосов
/ 28 мая 2020

enter image description here

Здравствуйте, я пытаюсь увидеть логистическую c связь между классификацией нормальных образцов и образцов рака на основе экспрессии этих 5 генов из таблицы выше . Я расположил свой набор данных так, чтобы он выглядел как таблица ниже

Я написал свой код, который показан под таблицей. Мне было интересно, почему gene1 не отображается в моей сводке результатов в регрессии logisti c. Я преобразовал гены в факторы, но ген 1 по какой-то причине не обнаруживается. Может кто-нибудь объяснить, что здесь не так?

enter image description here

mynewdata$genes <- as.factor(mynewdata$genes)
mynewdata$label <-as.factor(mynewdata$label)
#mynewdata$label
is.factor(mynewdata$genes)
is.factor(mynewdata$label)
set.seed(123)
training.samples <- mynewdata$label %>% 
 createDataPartition(p = 0.8, list = FALSE)
train.data  <- mynewdata[training.samples, ]
test.data <- mynewdata[-training.samples, ]
model <- glm( label ~., data = train.data, family = binomial)
# Summarize the model
summary(model)$coef

Мои результаты выглядят так: enter image description here

Я не уверен, что делаю здесь не так. «Гены 1» не отображаются по какой-то причине. Чтобы увидеть взаимосвязь между различными генами и раком и нормальными клетками, я должен просто сделать 5 отдельных столбцов в моем файле Excel с каждым геном для запуска моей логистической c регрессии?

...