Этот вопрос является расширением предыдущего вопроса , который я задал, с немного более сложными данными.Это кажется довольно простым, но я уже несколько дней бьюсь головой об стену.
Мне нужно создать графики процентной доли распространенности зависимой переменной (choice
) независимойпеременные ses
(ось x) и agegroup
(возможно, группировка гистограмм с накоплением).В идеале я хотел бы, чтобы график был двухсторонним, с одним аспектом на пол.
Соответствующая часть моих данных представлена в следующем виде:
subject choice agegroup sex ses
John square 2 Female A
John triangle 2 Female A
John triangle 2 Female A
Mary circle 2 Female C
Mary square 2 Female C
Mary rectangle 2 Female C
Mary square 2 Female C
Hodor hodor 5 Male D
Hodor hodor 5 Male D
Hodor hodor 5 Male D
Hodor hodor 5 Male D
Jill square 3 Female B
Jill circle 3 Female B
Jill square 3 Female B
Jill hodor 3 Female B
Jill triangle 3 Female B
Jill rectangle 3 Female B
... [about 12,000 more observations follow]
Я хочу использовать ggplot2
за его мощность и гибкость, а также за очевидную простоту использования.Но каждый учебник или практические рекомендации, которые я обнаружил, начинаются с 90% уже проделанной работы, поскольку они просто загружают один из встроенных наборов данных, предоставляемых R или его пакетами.Но, конечно, мне нужно использовать свои собственные данные.
Я знаю о необходимости преобразовать их в longform, чтобы ggplot2
мог их использовать, но я просто не смогчтобы сделать это правильно.И я стал еще более смущенным всеми различными пакетами манипулирования данными, которые существуют, и тем, что некоторые, кажется, являются частью других, или что-то в этом роде.
РЕДАКТИРОВАТЬ: я начинаюПоймите, что построение этого с линейным графиком, согласно моему первоначальному вопросу, не сработает.По крайней мере, я так не думаю сейчас.Итак, вот макет возможного способа построения графика этого набора данных (с вымышленными значениями):
Цвета представляют различные ответы на choice
.
Может кто-нибудь помочь мне с этим?И если у вас есть какие-либо предложения для лучшего способа визуализации данных, пожалуйста, поделитесь!