Как отобразить метки в geom_text, которые пропорциональны групповой переменной geom_bar - PullRequest
1 голос
/ 26 января 2020

Я пытался вывести в ggplot график, который показывает метки в процентном значении и пропорционально коэффициенту группировки, определенному в geom_bar. Вместо значений в процентах, пропорциональных общей численности населения, я хотел бы вывести значение метки, пропорциональное каждой подгруппе (в данном случае это место A и место B), но мне это не удалось. Смотрите ниже воспроизводимый пример

Воспроизводимый кадр данных

Random<-data.frame(replicate(3,sample(0:3,3024,rep=TRUE)))
Random$Trxn_type <- sample(c("Debit", "Credit"),
                       size = nrow(Random), 
                       prob = c(0.76, 0.24), replace = TRUE)
Random$YN <- sample(c("Yes", "No"),
                       size = nrow(Random), 
                       prob = c(0.76, 0.24), replace = TRUE)
Random$Place <- sample(c("PlaceA", "PlaceB"),
                       size = nrow(Random), 
                       prob = c(0.76, 0.24), replace = TRUE)

Random<-Random[, 4:6]

Затем применили следующий код

Share<-ggplot(Random, aes(x = YN, fill=Place)) +
scale_fill_brewer(palette="Greens")+
geom_bar(aes(y = ..prop.., group = Place),position = position_dodge()) + 
facet_wrap(~ Random$Trxn_type, scales = "free_x", ncol=2)+ 
theme(strip.text.x = element_text(size = 15, colour = "black"))+
theme(panel.background = element_rect(fill = "white"),legend.position = "bottom")+
scale_y_continuous(labels = percent)+
ylab("Frequency") + 
coord_flip()+ 
xlab("Answers") + 
theme(plot.title = element_text(size = 16, face = "bold"),
      axis.text=element_text(size=12),
      axis.title=element_text(size=12))+
geom_text(aes(y=..prop..,label=scales::percent((..count..)/tapply(..count..,..PANEL..,sum)[..PANEL..])),
          stat="count", vjust=-.5, position=position_dodge(.9)) 
Share

И получили следующий вывод

enter image description here

Вместо этого процентного распределения я хотел бы видеть процентное значение ответов с учетом места A и места B как двух отдельных групп населения. Проще говоря, я бы хотел, чтобы метки отображали значение в%, соответствующее размеру столбцов гистограммы, таким образом, чтобы гистограммы для места A в кредит суммировались до 100, а гистограммы для места B в кредит - до 100. То же самое относится и к дебету.

Спасибо!

1 Ответ

1 голос
/ 27 января 2020

Вот решение, которое вычисляет пропорции с dplyr, а затем передает результат в ggplot.
Я также поместил все настройки theme в одном вызове в theme().
I повторно разместил код создания данных, на этот раз установив начальное значение ГСЧ, чтобы сделать пример данных воспроизводимым.

library(dplyr)
library(ggplot2)

Random %>%
  count(Trxn_type, YN, Place) %>%
  left_join(Random %>% count(Trxn_type, name = "m"), by = "Trxn_type") %>%
  mutate(Prop = n/m) %>%
  ggplot(aes(x = YN, y = Prop, fill = Place)) +
  geom_col(position = position_dodge()) +
  geom_text(aes(label = scales::percent(Prop)),
            hjust = -0.25, 
            position = position_dodge(0.9)) +
  facet_wrap(~ Trxn_type, scales = "free_x", ncol = 2) +
  scale_fill_brewer(palette = "Greens") +
  scale_y_continuous(limits = c(0, 1), labels = scales::percent) +
  xlab("Answers") +
  ylab("Frequency") +
  coord_flip() +
  theme(panel.background = element_rect(fill = "white"),
        legend.position = "bottom",
        strip.text.x = element_text(size = 15, colour = "black"),
        plot.title = element_text(size = 16, face = "bold"),
        axis.text = element_text(size = 12),
        axis.title = element_text(size = 12))

enter image description here

Редактировать .

После комментария ОП, здесь также есть способ подсчета на Place. только изменение кода выше является left_join инструкция.

  left_join(Random %>% count(Trxn_type, Place, name = "m"),
            by = c("Trxn_type", "Place")) %>%

enter image description here

Код создания данных .

set.seed(1234)
Random <- data.frame(replicate(3,sample(0:3,3024,rep=TRUE)))
Random$Trxn_type <- sample(c("Debit", "Credit"),
                           size = nrow(Random),
                           prob = c(0.76, 0.24), replace = TRUE)
Random$YN <- sample(c("Yes", "No"),
                    size = nrow(Random),
                    prob = c(0.76, 0.24), replace = TRUE)
Random$Place <- sample(c("PlaceA", "PlaceB"),
                       size = nrow(Random),
                       prob = c(0.76, 0.24), replace = TRUE)

Random <- Random[, 4:6]
...