прогнозирование категориальной переменной с помощью продолжающихся переменных - PullRequest
0 голосов
/ 03 августа 2020

Я провожу логистический c регрессионный анализ, чтобы предсказать категориальную переменную (пол) по более чем одной непрерывной переменной. Однако я сталкиваюсь с некоторыми ошибками, и мне действительно нужен кто-то, чтобы помочь мне.

Здесь я помещаю данные моделирования и коды.

library(tidyverse)
library(broom)
library(purrr)

data <- data.frame(cat = rep(c("A", "B", "C", "D"), each = 20),
                      shar = rep(c("fr", "bs"), each = 20),
                      sex = rep(c("f", "m"), each = 20),
                      bmi = runif(20, min = 0, max = 30),
                      fbg = runif(20, min = 70, max = 140),
                      AB = runif(20, min = 0, max = 1),
                      Ac = runif(20, min = 0, max = 1),
                      Ad = runif(20, min = 0, max = 3),
                      Ae = runif(20, min = 0, max = 4),
                      Af = runif(20, min = 2, max = 4),
                      Ba = runif(20, min = 2, max = 10),
                      Bb = runif(20, min = 10, max = 40),
                      Bc = runif(20, min = 5, max = 50),
                      BD = runif(20, min = 0.5, max = 1),
                      BF = runif(20, min = 5, max = 10),
                      Ca = runif(20, min = 2, max = 10),
                      Cb = runif(20, min = 10, max = 40),
                      Cc = runif(20, min = 5, max = 50),
                      CD = runif(20, min = 0.5, max = 1),
                      CF = runif(20, min = 5, max = 10))

data1 <- data %>% 
  gather(Fac, value, -cat:-sex) %>% 
  split(.$Fac)  %>% 
  map(~glm(sex ~ value,family = binomial(link = "logit"), data =.) %>%  
        tidy(.) %>% 
        select(estimate, std.error,statistic,p.value) %>% 
        slice(2)) %>% 
  bind_rows(.id = "variables") 

Это была ошибка

Ошибка в eval (family $ initialize): значения y должны быть 0 <= y <= 1. </p>

Затем я изменил полученный код, но все равно получил ошибку

data$gendr <- ifelse(data$sex =="m",1L,0L)
data1 <- data %>% 
  gather(Fac, value, -cat:-sex) %>% 
  split(.$Fac)  %>% 
  map(~glm(gendr ~ value,family = binomial(link = "logit"), data =.) %>%  
        tidy(.) %>% 
        select(estimate, std.error,statistic,p.value) %>% 
        slice(2)) %>%  ## Extracting regression of genes
  bind_rows(.id = "varaibles")

Ошибка была

Ошибка в eval (predvars, data, env): объект 'gendr' не найден

Спасибо!

...