Кривая ROC с использованием пакета plotROC и geom_roc (), преобразовывающая данные в «маркеры M1» - PullRequest
0 голосов
/ 22 ноября 2018

Я пытаюсь построить кривую ROC, используя пакет plotROC для ggplot2, но я не уверен, как преобразовать имеющиеся у меня данные в формат маркера M1.Документация предоставила следующий пример:

# plotROC documentation example
library(plotROC)
library(ggplot2)
D.ex <- rbinom(200, size = 1, prob = .5)
M1 <- rnorm(200, mean = D.ex, sd = .65)
M2 <- rnorm(200, mean = D.ex, sd = 1.5)

D         M1         M2
1  1.4995932  0.5508204
1  0.4181619  1.6339181
0 -0.3620614 -1.0428972
1  0.7991132 -1.6396751
0  0.9574047  2.1159753
1  1.3440595  1.3026485

test <- data.frame(D = D.ex, D.str = c("Healthy", "Ill")[D.ex + 1], 
               M1 = M1, M2 = M2, stringsAsFactors = FALSE)

ggplot(test, aes(d = D, m = M1)) + 
   geom_roc()

Пример вывода графика ROC по plotROC

Мои данные - это баллы логистической регрессии на тестовом подмножестве:

# Example starting point
test <- rbinom(200, size = 1, prob = 0.2)
scores.prob <- runif(200, min = 0 , max = 1)
scores.class <- ifelse(scores.prob > 0.5, 1, 0)

# Example generated data
test scores.prob scores.class
 0   0.7323306            1
 0   0.7860687            1
 0   0.9535123            1
 1   0.3082551            0
 0   0.5762784            1
 1   0.4613730            0

Я хотел бы знать, что такое M1 и как преобразовать мои данные, чтобы получить это поле.

1 Ответ

0 голосов
/ 22 ноября 2018
library(plotROC) 
library(ggplot2) 
test <- rbinom(200, size = 1, prob = 0.2)
scores.prob <- runif(200, min = 0 , max = 1) 
test <- data.frame(D = test,
           M1 = scores.prob, stringsAsFactors = FALSE)
ggplot(test, aes(d = D, m = M1)) + 
geom_roc()

Ваш маркер / предиктор - это установленные значения вашей модели glm.ROC даст вам представление о том, как работает ваша модель (посредством AUC), и о пороге наилучшей вероятности (отсечение ROC) для назначения людей на занятия.Это полезный подход, если вы хотите визуализировать добавленную стоимость различных многовариантных / одномерных подходов.Вот полный пример с набором данных mtcars.Надеюсь, это поможет.

# Loading data
data(mtcars)
# Manual transmission (am = 1) depends on 1/4 mile time (qsec) and miles/(US) gallon (mpg)
glmfit <- glm(am ~ qsec + mpg, data = mtcars, binomial)
mtcars$fitted_am <- glmfit$fitted.values
# Loading packages
library(plotROC)
library(ggplot2)
library(pROC)
# Calculating ROC curve, AUC and threshold according to Youden index
rocfit <- roc(mtcars$am, mtcars$fitted_am)
auc(rocfit)
coords(rocfit, x = "b")
basicplot <- ggplot(mtcars, aes(d = am, m = fitted_am))
basicplot + 
  geom_roc() + 
  style_roc(theme = theme_grey) +
  theme(axis.text = element_text(colour = "blue")) +
  ggtitle("Automatic transmission prediction") +
  scale_x_continuous("1 - Specificity", breaks = seq(0, 1, by = .1))
plot(rocfit)
prop.table(table(mtcars$am))
...