Линейный график в ggplot с использованием данных продольной панели - PullRequest
1 голос
/ 23 апреля 2020

У меня есть набор данных с продольной панелью с информацией о том, где кто-то жил в течение определенного года, его профессия, и фиктивная переменная, указывающая, переместился ли человек или нет.

Теперь я пытаюсь создать линейный график в ggplot, чтобы визуализировать, как эти движения меняются со временем. Я хочу рассчитать долю, которая перемещается каждый год. Тем не менее, я не уверен, как сгруппировать всех людей по годам, а также включить манекен, указывающий, переехал ли кто-то или нет. Кроме того, я хотел бы видеть, как эти движущиеся колебания отличались между различными профессиями.

Набор данных выглядит примерно так:

df <- tibble(id = rep(1:5, each = 5),
             year = rep(2010:2014, 5),
             moved = c(1, 0, 0, 0, 1, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1),
             occupation = c('carpenter','carpenter', 'carpenter', 'carpenter', 'carpenter', 'cleaner',
                            'cleaner', 'cleaner', 'cleaner', 'cleaner', 'mechanic', 'mechanic',
                            'mechanic', 'mechanic', 'mechanic', 'carpenter', 'carpenter', 'carpenter',
                            'carpenter', 'carpenter', 'cleaner', 'mechanic', 'carpenter', 'cleaner',
                            'cleaner'))

Был бы признателен за любую помощь!

1 Ответ

0 голосов
/ 23 апреля 2020

Может как то так? Таким образом, вы группируете занятие, указав его в качестве цвета, затем в каждой точке вы используете stat_summary для расчета доли (среднего) и соединяете их с помощью линии:

ggplot(df,aes(x=year,y=moved,col=occupation)) + 
stat_summary(fun=mean,geom="point") + 
stat_summary(fun=mean,geom="line",alpha=0.7,linetype="dashed")

enter image description here

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...