Штриховая гистограмма с множеством бинарных переменных в Ggplot2 - PullRequest
0 голосов
/ 08 февраля 2019

Я хотел бы создать график, который показывает количество голосов «Да» в трех различных переменных (Всего, Интервью, Нанимать) на основе третьей переменной (Год). Также стоит отметить, что нет фактической переменной Всего, скорееэто всего лишь общие наблюдения

Я пытаюсь сделать это в ggplot2, однако все, что я пробовал, не дало результатов, которые я искал.Я легко могу уклониться от одного и нанести на график, используя geom_bar, но я не уверен, как представить 2 разные переменные.

 app <- structure(list(Applicant_Name = c("Aaraf", "Alaina", 
 "Aleena", "Alejandra", "Alexa", "Alexander", 
 "Alexandra", "Alexandra", "Alexandria", 
 "Alexis"), Interview = c("No", "No", "Yes", "Yes", "No", 
 "Yes", "Yes", "Yes", "Yes", "Yes"), Hire = c("No", "No", "Yes", 
 "No", "No", "No", "No", "No", "Yes", "Yes"), Year = c(2022, 2020, 
 2021, 2021, 2022, 2022, 2020, 2020, 2020, 2022), School = c("School of Business", 
 "Columbian Coll of Arts & Sci", "Milken Inst Sch of Public Hlth", 
 "Columbian Coll of Arts & Sci", "School of Engin & App Sc", "Columbian Coll of Arts & Sci", 
 "Columbian Coll of Arts & Sci", "Columbian Coll of Arts & Sci", 
 "School of Business", "Columbian Coll of Arts & Sci"), Major = c("Pre-Business Administration", 
 "Biological Anthropology", "Public Health", "Biological Anthropology", 
 "Systems Engineering", "Arts & Sciences", "Neuroscience", "English", 
 "International Business", "Arts & Sciences"), Ethnicity = c("Black or African American", 
 "White", "White", "Nonresident alien", "White", "White", "Race/ethnicity unknown", 
 "Two or More Race Codes", "Black or African American", "Black or African American"
 ), Sex = c("Female", "Female", "Female", "Female", "Female", 
 "Male", "Female", "Female", "Female", "Female"), GPA = c(3.221428, 
 3.230158, 3.429268, 3.576595, 3.86, 4, 3.460759, 3.89315, 3.227631, 
 1.433333)), row.names = c(NA, -10L), class = c("tbl_df", "tbl", 
 "data.frame"))

 ggplot(app, aes(Year, ..count..)) + geom_bar(aes(fill = Hire), position = "dodge")

В идеале, я хотел бы, чтобы график, показывающий наше общее число кандидатов (все наблюдения) рядом собщее количество интервью = да рядом с общим количеством найма = да, с разбивкой по годам.

Вот наглядный пример с моими прекрасными художественными способностями.https://imgur.com/a/mGyzBfJ

1 Ответ

0 голосов
/ 08 февраля 2019

Использование dplyr и tidyr для непосредственного получения данных, которые вы хотите построить:

library(dplyr)
library(tidyr)
library(ggplot2)
app2 <- app %>% 
  group_by(Year) %>% 
  summarise(Total = n(),
            Interviewed = sum(Interview == "Yes"),
            Hired = sum(Hire == "Yes")) %>% 
  gather( "category", "counts", -Year)

И тогда прямое построение графика:

ggplot(app2, aes(Year, counts)) + 
  geom_col(aes(fill = category), position = "dodge")

enter image description here

...