Как я могу использовать mutate, чтобы найти разницу между двумя годами в одном столбце моего кадра данных? - PullRequest
0 голосов
/ 29 марта 2019

Привет, я новичок в Tidyverse в R и пытаюсь работать над проектом

Мой фрейм данных (ab):

 Year       Zip     Total_Population Median_Income      City State
1 2014      00601            18088         10833  Adjuntas    PR
2 2014      00602            40859         16353    Aguada    PR
3 2015      00603            53162         16323 Aguadilla    PR
4 2015      00606             6415         14138   Maricao    PR
5 2016      00610            28805         17265    Anasco    PR
6 2016      00612            66251         17752   Arecibo    PR

Я использовал mutate для создания соотношения населения и доходов на основе индекса:

dmg_ratio <-  ab %>% filter(Year %in% c(2014,2015,2016,2017)) %>% 
  group_by(Zip) %>%
  mutate(Poptoincomeratio = Total_Population/Median_Income)

dmg_ratio

Выходной репекс:

Year Zip           Total_Population Median_Income City      State Poptoincomeratio
 2014 ZCTA5 00601            18088         10833 Adjuntas    PR               1.67 
 2014 ZCTA5 00602            40859         16353 Aguada      PR               2.50 
 2015 ZCTA5 00601            53162         16323 Adjuntas    PR               3.26 

Я хочу найти разницу в этой недавно созданной мутации (Poptoincomeratio) с 2014 по 2016 год по почтовому индексу, чтобы понять, было ли какое-либо изменение в соотношении населения к доходу за эти годы. Как я смогу сделать это?

1 Ответ

0 голосов
/ 29 марта 2019

На самом деле, есть обходной путь для этого, я предположил, что у вас есть столбцы «Poptoincomeratio» заполнены для каждого года Затем попробуйте это

library(tidyr)
new_ab <- ab %>% select(-Total_Population ,-Median_Income ) %>% spread(Year,Poptoincomeratio)

После этого вы можете снова применить mutate, чтобы получить разницу между двумя годами.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...