Использование вторичной оси Y в ggplot2 с другим масштабным коэффициентом при использовании facet_wrap - PullRequest
3 голосов
/ 02 мая 2020

Предположим, у меня есть следующие данные:

library(ggplot2)
library(ggthemes)

data = structure(list(origin = c("ARG", "ARG", "ARG", "ARG", "CHL", 
"CHL", "CHL", "CHL", "COL", "COL", "COL", "COL", "MEX", "MEX", 
"MEX", "MEX"), date = c(2012, 2013, 2014, 2015, 2012, 2013, 2014, 
2015, 2012, 2013, 2014, 2015, 2012, 2013, 2014, 2015), reer = c(99.200680735245, 
88.1100217095859, 91.138945064955, 38.2318792759958, 97.1355065168361, 
96.1872670893033, 93.6345905776444, 92.1029850680499, 101.123844098755, 
94.173001658586, 77.1226216761908, 59.6337376438912, 98.0983258996167, 
97.6713495865999, 92.2842729861424, 86.2605669691898), x_r = c(0.0874733578362671, 
0.0815610804254794, 0.0783917054809495, 0.0579932868099816, 0.178204232427659, 
0.16321408066481, 0.170084977520404, 0.151329817378872, 0.0498810245214703, 
0.0429419825495197, 0.0383271589817956, 0.0413797639710004, 0.246549060641858, 
0.242694346464116, 0.236773340112642, 0.269553103263527)), class = c("grouped_df", 
"tbl_df", "tbl", "data.frame"), row.names = c(NA, -16L), groups = structure(list(
    origin = c("ARG", "CHL", "COL", "MEX"), .rows = list(1:4, 
        5:8, 9:12, 13:16)), row.names = c(NA, -4L), class = c("tbl_df", 
"tbl", "data.frame")))

Я пытаюсь построить график, используя facet_wrap вместе со вторичной осью Y, используя параметр sec.axis, равный scale_y_continuous. Пока что я получил следующее:

scale = 500

ggplot(data, aes(x = date)) +
  geom_line(aes(y = x_r), size = 2, color = "red") + 
  geom_line(aes(y = reer/scale), size = 2, color = "blue") +
  facet_wrap(.~origin, ncol = 4, scales = "free_y") + 
  scale_y_continuous(
    name = "X/GDP",
    sec.axis = sec_axis(~.*scale, name = "REER")
  ) +   
  theme_bw() +
  theme(
    axis.title.y = element_text(color = "red", size = 13),
    axis.title.y.right = element_text(color = "blue", size = 13)
  ) +
  ggtitle("Export Ratio and Real Effective Exchange Rate")

enter image description here

Тем не менее, коэффициент scale, который я использую, является постоянным (масштаб = 500 ) для всех стран, я хотел бы иметь разные масштабные коэффициенты для каждой страны. Что-то вроде scaleFactor1 = max(x_r)/max(reerr). Я знаю, что sec.axis опция scale_y_continuous представляет собой линейную комбинацию главной оси y, но я хочу, чтобы она была разной для каждой страны. Я пробовал следующее, но это не работает:

data = data %>% 
  group_by(origin) %>% 
  mutate(scaleFactor = max(x_r)/max(reerr)) %>% 
  mutate(reer_2 = reerr/scaleFactor)

ggplot(data, aes(x = date)) +
  geom_line(aes(y = x_r), size = 2, color = "red") + 
  geom_line(aes(y = reer), size = 2, color = "blue") +
  facet_wrap(.~origin, ncol = 4, scales = "free_y") + 
  scale_y_continuous(
    name = "X/GDP",
    sec.axis = sec_axis(~.*scaleFactor, name = "REER")
  ) +   
  theme_bw() +
  theme(
    axis.title.y = element_text(color = "red", size = 13),
    axis.title.y.right = element_text(color = "blue", size = 13)
  ) +
  ggtitle("Export Ratio and Real Effective Exchange Rate")

1 Ответ

1 голос
/ 03 мая 2020

Один из способов - разделить данные по стране и создать отдельные участки, сохранив их в списке. Затем используйте пакет cowplot , чтобы построить их в виде сетки, аналогично facet_wrap из ggplot .

Это ваш код для создания графиков, за вычетом facet_wrap, создание scaleFactor и объекта Country для заголовков.

myPlot <- function(data){

  scaleFactor <- max(data$reer) / max(data$x_r)
  Country <- data$origin

  p <- ggplot(data, aes(x = date)) +
    geom_line(aes(y = x_r), size = 2, color = "red") + 
    geom_line(aes(y = reer/scaleFactor), size = 2, color = "blue") +
    #facet_wrap(.~origin, ncol = 4, scales = "free_y") + 
    scale_y_continuous(
      name = "X/GDP",
      sec.axis = sec_axis(~.*scaleFactor, name = "REER")
    ) +   
    theme_bw() +
    theme(
      axis.title.y = element_text(color = "red", size = 13),
      axis.title.y.right = element_text(color = "blue", size = 13)
    ) +
    ggtitle(Country)
  p
}

Теперь split данные о источнике и использование lapply для вызова функции myPlot.

data2 <- split(data, data$origin)
p_lst <- lapply(data2, myPlot)

Создайте заглавный сюжет и используйте plot_grid, чтобы расположить их в сетке.

p0 <- ggplot() + labs(title="Export Ratio and Real Effective Exchange Rate")

library(cowplot)

p1 <- plot_grid(plotlist=p_lst, ncol=2)
pp <- plot_grid(p0, p1, ncol=1, rel_heights=c(0.1, 1))

enter image description here

...