Как исправить маркировку уравнения линии регрессии на графике (используя ggplot2) - PullRequest
0 голосов
/ 15 ноября 2018

Когда я запускаю следующий код в rstudio (см. Ниже), все выглядит отлично, за исключением уравнения линейной регрессии.Вместо того чтобы получить y = 3,142x -4,751, я получаю y = c (3.142) xc (-4,751).

Что я могу сделать, чтобы это исправить?Заранее большое спасибо.

set.seed(3L)
library(ggplot2)

df <- data.frame(x = c(1:100))
df$y <- 2 + 3 * df$x + rnorm(100, sd = 40)
lm_eqn <- function(df){

# browser()
m <- lm(y ~ x, df)
a <- coef(m)[1]
a <- ifelse(sign(a) >= 0, 
     paste0(" + ", format(a, digits = 4)), 
     paste0(" - ", format(-a, digits = 4))  )

eq1 <- substitute( paste( italic(y) == b, italic(x), a ),
     list(a = a, 
          b = format(coef(m)[2], digits=4)))

eq2 <- substitute( paste( italic(R)^2 == r2 ), 
     list(r2 = format(summary(m)$r.squared, digits = 3)))

c( as.character(as.expression(eq1)), as.character(as.expression(eq2)))
}

labels <- lm_eqn(df)

p <- ggplot(data = df, aes(x = x, y = y)) +
geom_smooth(method = "lm", se=FALSE, color="red", formula = y ~ x) +
geom_point() +
geom_text(x = 75, y = 90, label = labels[1], parse = TRUE,  check_overlap = TRUE ) +
geom_text(x = 75, y = 70, label = labels[2], parse = TRUE, check_overlap = TRUE )

print(p)

1 Ответ

0 голосов
/ 15 ноября 2018

В вашей функции lm_eqn функция format дает ваши именованные векторы. Удаляя имена, вы решаете свою проблему следующим образом:

set.seed(3L)
library(ggplot2)

df <- data.frame(x = c(1:100))
df$y <- 2 + 3 * df$x + rnorm(100, sd = 40)
lm_eqn <- function(df){

  # browser()
  m <- lm(y ~ x, df)
  a <- coef(m)[1]
  a <- ifelse(sign(a) >= 0, 
              paste0(" + ", format(a, digits = 4)), 
              paste0(" - ", format(-a, digits = 4))  )

  b <-  format(coef(m)[2], digits=4)
  names(a) <- names(b) <-NULL
  eq1 <- substitute( paste( italic(y) == b, italic(x), a ),
                     list(a = a, 
                          b = b))

  eq2 <- substitute( paste( italic(R)^2 == r2 ), 
                     list(r2 = format(summary(m)$r.squared, digits = 3)))

  c( as.character(as.expression(eq1)), as.character(as.expression(eq2)))
}

labels <- lm_eqn(df)

p <- ggplot(data = df, aes(x = x, y = y)) +
  geom_smooth(method = "lm", se=FALSE, color="red", formula = y ~ x) +
  geom_point() +
  geom_text(x = 75, y = 90, label = labels[1], parse = TRUE,  check_overlap = TRUE ) +
  geom_text(x = 75, y = 70, label = labels[2], parse = TRUE, check_overlap = TRUE )

print(p)

Результат:

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...