График с упорядоченными барами и использованием граней - PullRequest
0 голосов
/ 16 мая 2018

Я пытаюсь построить график с упорядоченными столбцами в зависимости от частоты, а также с помощью переменной две отдельные две переменные с использованием фасетов. Слова должны быть упорядочены по значению, указанному в переменной 'n'. Итак, мой график должен выглядеть так: этот , который появляется в книге тидитекста: enter image description here

Мой график ниже, слова не упорядочены по значению , в чем моя ошибка ?: enter image description here Мои данные выглядят так же, как в примере:

> d
# A tibble: 20 x 3
   word    u_c            n
   <chr>   <chr>      <dbl>
 1 apples  candidate 0.567 
 2 apples  user      0.274 
 3 melon   user      0.191 
 4 curcuma candidate 0.105 
 5 banana  user      0.0914
 6 kiwi    candidate 0.0565
 ...

Следуя коду, указанному в книге, и модифицируя его согласно моим данным, код выглядит следующим образом:

d %>% 
  mutate(word = reorder(word, n)) %>%
  ggplot(aes(word, n, fill = u_c)) + 
  geom_col(show.legend = F) +
  facet_wrap(~u_c, scales = "free_y") +
  coord_flip()

Вот dput для d:

d <- structure(list(word = c("apples", "apples", "melon", "curcuma", 
                             "banana", "kiwi", "grape", "curcuma", "grape", 
                             "wood", "satsuma", "melon", "raisin", "papaya", "plum", 
                             "plum", "papaya", "banana", "satsuma", "peach"), u_c = c("candidate", 
                                                                                      "user", "user", "candidate", "user", "candidate", "user", "user", 
                                                                                      "candidate", "user", "user", "candidate", "user", "candidate", 
                                                                                      "candidate", "user", "user", "candidate", "candidate", "candidate"
                             ), n = c(0.56704584625991, 0.273789875549109, 0.190633674260422, 
                                         0.105308514305412, 0.0914084706627656, 0.0565322302654257, 0.0562029558128485, 
                                         0.0547338017954938, 0.0498104102033781, 0.0439600056682254, 0.0393399851625864, 
                                         0.0380903136849362, 0.0370685271783074, 0.0370561875215443, 0.035849706997587, 
                                         0.0352763676677753, 0.0325506180866405, 0.0206825232678387, 0.0198207514650121, 
                                         0.0113753877973113)), class = c("tbl_df", "tbl", "data.frame"
                                         ), row.names = c(NA, -20L))

Ответы [ 2 ]

0 голосов
/ 16 мая 2018

Учитывая информацию, предоставленную @GordonShumway и следуя ответу, данному @CPak, ниже я предоставляю полный и «хитрый» и не элегантный способ решения этой проблемы. Почти полный ответ (@CPak) и еще одна строка, наконец, решают проблему:

d %>%
  mutate(temp = paste(word, u_c, sep = "_")) %>%
  ggplot(aes(x = fct_reorder(temp, n), y = n, fill = u_c)) +
  geom_col(show.legend = F) +
  scale_x_discrete(labels = function(x) str_replace(x,"_candidate|_user", "")) +
  facet_wrap(~u_c, scales = "free_y") + 
  coord_flip()

enter image description here

Спасибо за ответы!

0 голосов
/ 16 мая 2018

Очень важный комментарий в стороне от GordonShumway (потому что предлагаемое решение - немного чёрной магии) - вы можете создать временное значение, чтобы изменить порядок вашего фасета - обратите внимание, что я использую forcats::fct_reorder вместо reorder

library(tidyverse)
d %>%
  mutate(temp = paste0(word, u_c)) %>%
  ggplot(aes(x = fct_reorder(temp, n), y = n, fill = u_c)) +
  geom_col(show.legend = F) +
  facet_wrap(~u_c, scales = "free_y") + 
  coord_flip()
...