Исправлен порядок фасетов в ggplot при использовании dplyr для преобразования данных в длинную форму - PullRequest
0 голосов
/ 27 сентября 2018

Вчера я получил помощь по созданию сетки фасетов из нескольких столбцов.Это дало большую сетку, содержащую 8 * 5 графиков.Код создает комбинацию сюжета для различных результатов * Ответы.Например (Результат1 * Ответ1, Результат1 * Ответ2, Результат3 * Ответ1, Результат1 * Ответ1 и т. Д.).

Я вставил код ниже.

plot1 <- ancestralmeansindex %>%
gather(var1, value1, bicepind:wcind) %>%
gather(var2, value2, mmois:mpfat) %>%
ggplot(aes(x = value1, y = value2)) + 
geom_point(color='blue') +
geom_smooth(method = "lm", se = FALSE) +
facet_grid(var2 ~ var1, scales = "free", switch = "both",
         labeller = as_labeller(c(mmois = "Water (gms)",
                                  mkcal = "Caloric Intake",
                                  mprot = "Protein (gms)",
                                  mcarb = "Carb (gms)",
                                  mtfat = "Total Fat (gms)",
                                  msfat = "Saturated Fat (gms)",
                                  mmfat = "Mono S.Fat (gms)",
                                  mpfat = "Poly US.Fat (gms)",
                                  bicepind = "Bicep",
                                  tricepind = "Tricep",
                                  subind = "Subscapular",
                                  supind = "Suprailiac",
                                  weightind = "Weight",
                                  wcind = "Waist Circum"))) +
  labs(title = "Regression Plot Matrix of Mean Dietary Values with    Index Change 1", x = NULL, y = NULL) +
theme_bw() +
theme(strip.placement = "outside",
    strip.background = element_blank())
ggsave("Regression Plot 1.pdf", width = 210, height = 297, units = "mm", plot1) 

Это дает очень аккуратную сетку всех возможных комбинаций, упомянутых в коде.Тем не менее, график печатает графики в алфавитном порядке (как это отражено в метке / данных).Я хотел бы изменить этот порядок для var2 и var1.

Я прочитал в справке, что эту проблему можно решить, назначив уровни факторов и выбрав определенный порядок.Например, это решение Исправление порядка фасетов в ggplot

Как назначить уровни факторов для переменных, которые были преобразованы в длинную форму с помощью dplyr?Можно ли это сделать?Есть ли другое решение?

Edit1 Я пробовал решение ниже, но я сталкиваюсь с ошибкой.Воспроизводимый пример ниже.

set.seed(1)
dat <- data.frame(
  Outcome1 = sample(1:10),
  Outcome2 = sample(11:20),
  Outcome3 = sample(21:30),
  Response1 = sample(31:40),
  Response2 = sample(41:50),
  Response3 = sample(51:60)
)

dat %>%
  gather(var1, value1, Outcome1:Outcome3) %>%
  mutate(var1, recode("Outcome1" = "Bicep",
                      "Outcome2" = "Tricep",
                      "Outcome3" = "Subscapular")) %>%
  factor(var1, levels = c("Bicep",
                          "Tricep",
                          "Subscapular")) 
gather(var2, value2, Response1:Response3) %>% 
  mutate(var2, recode("Response1" = "Water (gms)", 
                      "Response2" = "Caloric Intake",
                      "Response3" = "Protein (gms)")) %>%
  factor(var2, levels = c("Water (cms)", 
                          "Caloric Intake",
                          "Protein (gms)")) %>%
  ggplot(aes(x = value1, y = value2)) + 
  geom_point(color='blue') +
  geom_smooth(method = "lm", se = FALSE) +
  facet_grid(var2 ~ var1, scales = "free", switch = "both",
             labeller = as_labeller(c(mmois = "Water (gms)",
                                      mkcal = "Caloric Intake",
                                      mprot = "Protein (gms)",
                                      bicepind = "Bicep",
                                      tricepind = "Tricep",
                                      subind = "Subscapular"))) +
  labs(title = "Regression Plot", x = NULL, y = NULL) +
  theme_bw() +
  theme(strip.placement = "outside",
        strip.background = element_blank())


Error in factor(., var1, levels = c("Bicep", "Tricep", "Subscapular",  : 
  object 'var1' not found

Error in gather(var2, value2, Response1:Response3) : 
  object 'var2' not found

1 Ответ

0 голосов
/ 27 сентября 2018

Да!Это может быть сделано.Используйте dplyr mutate до recode ваших переменных var1 и var2, затем используйте factor, чтобы убедиться, что уровни находятся в правильном порядке.Тогда вам не нужно будет использовать этикетировщик.Благодаря вашему воспроизводимому примеру я смог протестировать свое решение и исправить код!

 dat %>%
  gather(var1, value1, Outcome1:Outcome3) %>%
  mutate(var1 = recode(var1, "Outcome1" = "Bicep",
                      "Outcome2" = "Tricep",
                      "Outcome3" = "Subscapular")) %>%
  mutate(var1 = factor(var1, levels = c("Bicep",
                          "Tricep",
                          "Subscapular"))) %>% 
gather(var2, value2, Response1:Response3) %>% 
  mutate(var2 = recode(var2, "Response1" = "Water (gms)", 
                      "Response2" = "Caloric Intake",
                      "Response3" = "Protein (gms)"),
          var2 = factor(var2, levels = c("Water (gms)", 
                          "Caloric Intake",
                          "Protein (gms)"))) %>%
  ggplot(aes(x = value1, y = value2)) + 
  geom_point(color='blue') +
  geom_smooth(method = "lm", se = FALSE) +
  facet_grid(var2 ~ var1, scales = "free", switch = "both") +
  labs(title = "Regression Plot", x = NULL, y = NULL) +
  theme_bw() +
  theme(strip.placement = "outside",
        strip.background = element_blank())
...