Как я могу построить линейный график для распределения по возрасту в R? - PullRequest
0 голосов
/ 10 мая 2019

Я пытаюсь построить линейный график, показывающий распределение по возрасту (less1-less80) в пределах одного муниципалитета за все годы (2005-2012). Таким образом, каждый идентификатор муниципалитета указывает все процентные пункты за все годы. Позже я хочу объединить этот участок с другим участком, который показывает уровень смертности для того же муниципалитета и тех же лет. Моя цель - провести прямое сравнение между возрастным распределением и смертностью, чтобы увидеть, имеют ли муниципалитеты с более старшим населением более высокий уровень смертности.

Я искал такие решения, как Линейный график с накоплением R с ggplot и Как построить линейный граф стековых рядов в R? Однако я не смог найти решение, которое помогло бы мне с моими данными.

Вот как выглядит образец:

municipality_id     Date variable  value
1               110001 Jan 2005    less1  1.94%
2               110037 Jan 2005    less1  2.45%
3               110040 Jan 2005    less1  2.32%
4               110034 Jan 2005    less1  1.97%
5               110002 Jan 2005    less1  2.39%
6               110045 Jan 2005    less1  2.55%
7               110003 Jan 2005    less1  2.03%
489674          431475 Jan 2012   less80 96.29%
489675          431514 Jan 2012   less80 97.61%
489676          432055 Jan 2012   less80 97.71%


==X==============================================================X==
     Copy+Paste this part. (If on a Mac, it is already copied!)
==X==============================================================X==

 b4 <- structure(list(municipality_id = structure(c(1L, 26L, 27L, 25L,2L, 28L, 3L, 4924L, 4934L, 5033L), .Label = c("110001", "110002","110003", "110004", "110005", "110006", "110007", "110008", "110009","110010", "110011", "110012", "110013", "110014", "110015", "110018","110020", "110025", "110026", "110028", "110029", "110030", "110032","110033", "110034", "110037", "110040", "110045", "220100","220105", "220110", "220115", "220117", "220120", "220130", "220140","220150", "220155", "220157", "220160", "220170", "220173", "220177","220180", "220190", "220191", "220192", "220194", "220196", "220198","220200", "220202", "220205", "220207", "220208", "220209", "220210","220211", "220213", "220217", "220220", "220225", "220230", "240060","240070", "240080", "240090", "240100", "240110", "240120", "240130","240140", "240145", "240150", "240160", "240165", "240170", "240180","240185", "240190", "240200", "240210", "240220", "240230",  "270760","270770", "270780", "270790", "270800", "270810", "270820", "270830","270840", "270850", "270860", "270870", "270880", "270890", "270895","270900", "270910", "270915", "270920", "270930", "270940", "280010","280020", "280030", "280040", "280050", "280060", "280067", "280070","280100", "280110", "280120", "280130", "280140", "280150", "280160","280170", "280190", "280200", "280210", "280220", "280230", "280240","280250", "280260", "280270", "280280", "280290", "280300", "280310","280320", "280330", "280340", "280350", "280360", "280370", "280380","280390", "280400", "280410", "280420", "280430", "280440", "280445","280450", "280460", "280470", "280480", "280490", "280500",  "315810","315820", "315830", "315840", "315850", "315860", "315870", "315880","315890", "315895", "315900", "315910", "315920", "315930", "315935","315940", "315950", "315960", "315970", "315980", "315990", "316000","316010", "316020", class = "factor"),Date = structure(c(2005, 2005, 2005, 2005, 2005, 2005, 2005,2012, 2012, 2012), class = "yearmon"), variable = structure(c(1L,1L, 1L, 1L, 1L, 1L, 1L, 11L, 11L, 11L), .Label = c("less1","less5", "less10", "less15", "less20", "less30", "less40","less50", "less60", "less70", "less80"), class = "factor"),value = c("1.94%", "2.45%", "2.32%", "1.97%", "2.39%", "2.55%","2.03%", "96.29%", "97.61%", "97.71%")), row.names = c(1L,2L, 3L, 4L, 5L, 6L, 7L, 489674L, 489675L, 489676L), class = "data.frame") 

==X==============================================================X==

Моя общая data.frame имеет следующие функции:

'data.frame':   489676 obs. of  4 variables:
 $ municipality_id: int  110001 110037 110040 110034 110002 110045 110003         110060 110004 110070 ...
 $ Date           : 'yearmon' num  Jan 2005 Jan 2005 Jan 2005 Jan 2005 ...
 $ variable       : Factor w/ 11 levels "less1","less5",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ value          : chr  "1.94%" "2.45%" "2.32%" "1.97%" ...

Я пытался

ggplot(b4, aes(x=municipality_id, y=value, col=variable, group=municipality_id)) + geom_line()

ggplot(data = b4, mapping = aes(x = municipality_id)) + geom_freqpoly(mapping = aes(color = variable), binwidth = 10)

xyplot(value ~ municipality_id, data=b4, type='b', groups = municipality_id)

Я хочу, чтобы мой график выглядел примерно так, как здесь: https://www.google.com/search?q=plot+age+distribution+in+r&tbm=isch&source=univ&client=firefox-b-d&sa=X&ved=2ahUKEwj04qbshJHiAhXR5KQKHfeGB48Q7Al6BAgJEA8&biw=1354&bih=686#imgrc=Gmn8-rHwkiLEQM:

, где

года - муниципалитет_ид изобилие являются ценностями виды изменчивы (от менее 1 до менее 80)

...