ggplot2: добавьте p-значение, Rsq и наклон для нескольких столбцов - PullRequest
0 голосов
/ 02 ноября 2018

Допустим, у меня есть этот фрейм данных:

library(ggplot2)
Y <- rnorm(100)
df <- data.frame(A = rnorm(100), B = runif(100), C = rlnorm(100),
                 Y = Y)
colNames <- names(df)[1:3]
for(i in colNames){
  plt <- ggplot(df, aes_string(x=i, y = Y)) +
    geom_point(color="#B20000", size=4, alpha=0.5) +
    geom_hline(yintercept=0, size=0.06, color="black") + 
    geom_smooth(method=lm, alpha=0.25, color="black", fill="black")
  print(plt)
  Sys.sleep(2)
}

Я хочу создать модель lm и отобразить для каждого столбца скорректированные значения Rsq, Intercept, Slope и p-value. Я нашел пример ниже

data(iris)
ggplotRegression <- function (fit) {

require(ggplot2)

ggplot(fit$model, aes_string(x = names(fit$model)[2], y = names(fit$model)[1])) + 
  geom_point() +
  stat_smooth(method = "lm", col = "red") +
  labs(title = paste("Adj R2 = ",signif(summary(fit)$adj.r.squared, 5),
                     "Intercept =",signif(fit$coef[[1]],5 ),
                     " Slope =",signif(fit$coef[[2]], 5),
                     " P =",signif(summary(fit)$coef[2,4], 5)))
}

fit1 <- lm(Sepal.Length ~ Petal.Width, data = iris)
ggplotRegression(fit1)

Но это работает только для одного столбца. (Я взял примеры из этого вопроса ) и этого здесь )

Спасибо!

1 Ответ

0 голосов
/ 02 ноября 2018

Опираясь на комментарий выше, вы можете поместить подгонку внутри функции, а затем выполнить цикл с помощью lapply.

library(ggplot2)

Y <- rnorm(100)
df <- data.frame(A = rnorm(100), B = runif(100), C = rlnorm(100),
                 Y = Y)
colNames <- names(df)[1:3]


plot_ls <- lapply(colNames, function(x){


  fit <- lm(Y ~ df[[x]], data = df)
  ggplot(fit$model, aes_string(x = names(fit$model)[2], y = names(fit$model)[1])) + 
    geom_point() +
    scale_x_continuous(x)+
    stat_smooth(method = "lm", col = "red") +
    ggtitle(paste("Adj R2 = ",signif(summary(fit)$adj.r.squared, 5),
                       "Intercept =",signif(fit$coef[[1]],5 ),
                       " Slope =",signif(fit$coef[[2]], 5),
                       " P =",signif(summary(fit)$coef[2,4], 5))
            )
})

gridExtra::grid.arrange(plot_ls[[1]],plot_ls[[2]],plot_ls[[3]])

enter image description here

...