Форматирование Geom_Bar в ggplot2 - PullRequest
0 голосов
/ 24 февраля 2020

Привет У меня возникли проблемы с поиском правильного форматирования столбчатой ​​диаграммы в стеке, которую я пытаюсь создать в ggplot2. Я пытался найти ответы на предыдущие вопросы, но ни один из них, похоже, не отвечает на проблемы, с которыми я сталкиваюсь. Geom_Bar с использованием 1 + 2 в качестве фиктивных переменных На первом прикрепленном графике я близок к тому, что хочу на графике, но на шкале сбоку показаны 5 значений по сравнению с ('1' и '2'), которые единственные две переменные в кадре. По сути, я пытаюсь исправить шкалу заливки как имеющую только значения «1» и «2», и если можно было бы отредактировать их так, чтобы они говорили «Да» и «Нет». Ниже я прикрепил код:

    ggplot(AggSignedDummyVar, aes(fill=AggSignedDummyVar$`Signed by Drafting Club`, x = AggSignedDummyVar$`College Conference`, y = MLS_Draft_File$`Signed by Drafting Club`)) + 
  xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference') 

Я также попытался переписать код сверху, используя («Да» и «Нет»), в отличие от фиктивных переменных из приведенного выше кода. Кажется, что в этом разделе хранится количество вхождений, но он не отображает их и прикрепляет «Да» и «Нет» к нижней части оси Y (не должно быть). Geom_bar, но без фиктивной переменной . Я приложил код к этому ниже:

    ggplot(MLS_Draft_File_Aggregated_Non_Numeric_, aes(fill=MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`, x = MLS_Draft_File_Aggregated_Non_Numeric_$`College Conference`, y = MLS_Draft_File_Aggregated_Non_Numeric_$`Signed by Drafting Club`)) + 
  xlim('American Athletic Conference', 'Atlantic-10 Conference', 'Atlantic Coast Conference', 'Big East Conference', 'Big West Conference', 'Ivy League', 'Mid-American Conference', 'Pac-12 Conference', 'West Coast Conference') 

Надеюсь, я объяснил это правильно и заранее благодарю вас за любую помощь, которую вы можете предоставить.

1 Ответ

0 голосов
/ 24 февраля 2020

Если вы предоставляете ggplot::aes функцию переменной, ggplot пытается угадать , как вы хотите использовать эти данные. Если данные имеют числовое значение c, он использует их как непрерывную переменную, даже если есть только 2 различных значения. Если вы предоставляете ее, дискретная переменная ggplot использует ее соответственно.

Рассмотрим следующие два графика:

library(ggplot2)
ggplot(mtcars, aes(x=mpg, y=hp, fill=cyl)) + geom_bar(stat="identity")

continuous variable for fill

Переменная для fill является цифрой c -> ggplot, обрабатывает ее как непрерывную

Но здесь:

ggplot(mtcars, aes(x=mpg, y=hp, fill=factor(cyl))) + geom_bar(stat="identity")

factor for fill

Мы переделываем cyl как фактор перед передачей его в aes (мы также можем использовать символ, но фактор имеет преимущество в том, что мы можем указать порядок уровней. Этот порядок будет использоваться ggplot)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...