Я пытаюсь создать тепловую карту США с помощью urbnmapr, и у меня возникают проблемы с объединением данных в файл urbnmapr.
library(dplyr)
library(urbnmapr)
library(tidyverse)
library(ggplot2)
library(scales)
library(urbnthemes)
O<-as.data.frame(rbind(c(6071,1),c(14623,1),c(18157,1),c(18155,1),c(18167,0)))
colnames(O)<-c('O','num')
P<-urbnmapr::counties
P$county_fips<-as.numeric(as.character(P$county_fips))
data<-merge(P,O,by.x='county_fips',by.y="O",all.x=TRUE)
data%>%
filter(state_name =="California") %>%
ggplot(mapping = aes(long, lat, group = group, fill = county_fips)) +
geom_polygon(color = "#ffffff", size = .25)
P%>%
filter(state_name =="California") %>%
ggplot(mapping = aes(long, lat, group = group, fill = county_fips)) +
geom_polygon(color = "#ffffff", size = .25)
График с использованием объединенных данных выглядит следующим образом:
![enter image description here](https://i.stack.imgur.com/So45V.png)
The plot using the original data looks like this:
введите описание изображения здесь
Обратите внимание на линии в округе Сан-Бернадиньо, который является графством fips 6071, которые появляются на верхнем графике, но не на нижнем. Это постоянная проблема для каждого округа в наборе данных O, который я объединяю с P для формирования данных, я просто увеличил масштаб до Калифорнии, чтобы сделать его более заметным в этом посте. Я предполагаю, что в процессе слияния возникает какая-то проблема, но мне было интересно, знает ли кто-нибудь, что здесь происходит?