У меня есть список из 5000+ точек данных в CSV-файле, в котором указано состояние каждой точки данных (как в «Калифорнии» - «CA»).CSV имеет столбцы с указанием «Адрес, Город, Штат, ZIP», соответственно.Моя задача состоит в том, чтобы иметь карту штатов США и показывать плотность точек данных для каждого штата, где чем темнее состояние, тем больше точек данных находится в этом штате.Затем я должен также предоставить легенду, которая дает точное число в каждом штате (например, «Масахусетс [23]»).
Я нашел в сети код, который дает мне карту состояний с цветами, но я не уверен, что делать дальше (я ужасно разбираюсь в кодировании).Как я могу импортировать данные из файла CSV и просто показать местоположение, количество и плотность точек данных в контексте этого кода, и как я могу просто иметь состояния без раскраски?
Вот кодсоздание карты штатов США:
library(ggplot2)
library(ggmap)
library(maps)
library(mapdata)
states <- map_data("state")
dim(states)
#> [1] 15537 6
head(states)
#> long lat group order region subregion
#> 1 -87.46201 30.38968 1 1 alabama <NA>
#> 2 -87.48493 30.37249 1 2 alabama <NA>
#> 3 -87.52503 30.37249 1 3 alabama <NA>
#> 4 -87.53076 30.33239 1 4 alabama <NA>
#> 5 -87.57087 30.32665 1 5 alabama <NA>
#> 6 -87.58806 30.32665 1 6 alabama <NA>
tail(states)
#> long lat group order region subregion
#> 15594 -106.3295 41.00659 63 15594 wyoming <NA>
#> 15595 -106.8566 41.01232 63 15595 wyoming <NA>
#> 15596 -107.3093 41.01805 63 15596 wyoming <NA>
#> 15597 -107.9223 41.01805 63 15597 wyoming <NA>
#> 15598 -109.0568 40.98940 63 15598 wyoming <NA>
#> 15599 -109.0511 40.99513 63 15599 wyoming <NA>
ggplot(data = states) +
geom_polygon(aes(x = long, y = lat, fill = region, group = group),
color = "white") +
coord_fixed(1.3)