Средняя по округе широта и долгота - PullRequest
0 голосов
/ 18 апреля 2019

У меня большой фрейм данных (832 тыс. Строк) с широтой и долготой в сеточном формате плюс одна переменная.Я хотел бы построить среднее значение этой переменной для каждого округа.Проблема в том, что у меня нет идентификации округа или штата по точкам, только координаты.

Извините, я не уверен, как включить воспроизводимый пример

Ответы [ 2 ]

1 голос
/ 25 апреля 2019

Два подхода:

1) Рассчитать среднее значение по всем сеткам широты и долготы. Этот подход отклоняет ваш центр округа к сеткам с более высокой плотностью

2) Рассчитать границы [мин-макс широта / долгота] сеток и усреднить границы. Этот подход помещает центр округа точно в центр диапазона сетки.

0 голосов
/ 18 апреля 2019

Вам потребуется получить данные округа (или штата), а затем пространственно объединить их с вашим фреймом данных. Одним из возможных источников таких данных является шейп-файл TIGER, опубликованный переписью США (см., Например, https://catalog.data.gov/dataset/tiger-line-shapefile-2016-nation-u-s-current-county-and-equivalent-national-shapefile).

Затем вы можете использовать пакет sf, чтобы прочитать шейп-файл в R, объединить его с вашими данными, а затем использовать обычные функции суммирования для суммирования ваших данных по округам.

library(sf)

filename <- 'https://www2.census.gov/geo/tiger/TIGER2016/COUNTY/tl_2016_us_county.zip'
tmpfile <- tempfile()
tmpdir <- tempdir()
download.file(filename,tmpfile)
unzip(zipfile = tmpfile, exdir = tmpdir)
county_data <- st_read(paste0(tmpdir, '/tl_2016_us_county.shp'))
unlink(tmpfile)
unlink(tmpdir)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...