Как контролировать количество шума, добавляемого к x, y пространственным точкам в R? - PullRequest
2 голосов
/ 12 января 2020

Довольно начинающий пользователь R, и я уверен, что есть простое решение для этого - но я не могу его найти. У меня есть фрейм данных с рядом пространственных координат, а также множество других атрибутов. Многие из пространственных координат абсолютно одинаковы - и я хотел бы добавить к ним определенное количество шума, чтобы я мог держать их в пределах определенного радиуса - в этом случае 0,4 метра или 40 сантиметров, также отслеживая их связанные атрибуты.

По сути, я ищу версию этого вопроса на языке R: https://gis.stackexchange.com/questions/35479/adding-noise-to-overlapping-x-y-coordinates-so-no-longer-in-exact-same-place

... потому что, когда я следую инструкциям для ответа на этот вопрос, используя ArcGIS - Я получаю ряд случайных точек, но теряю атрибуты, связанные с этими точками, и не могу легко найти способ сопоставить их обратно.

Есть ли способ использовать функцию джиттера в R или что-то подобное и указать радиус в пространственном контексте (например, 40 см), чтобы пространственные координаты были случайно распределены в этом диапазоне? Я не понимаю, как манипулировать аргументом фактора и суммы, чтобы получить желаемый результат.

Редактировать:

Вот пример df с поддельными координатами. Как вы можете видеть, координаты в первом и третьем столбцах совпадают, потому что животное дважды находилось под одной и той же скалой. Я хотел бы иметь возможность добавить джиттер к этим координатам, чтобы они немного отличались, но я хочу, чтобы джиттер находился в пределах 40 сантиметров (не больше, чем размер камня)

mydf <- data.frame("point_id" = 1:6, "date_time" = c("6/5/2018 10:57","6/5/2018 14:30","6/6/2018 10:06","6/6/2018 11:06","6/7/2018 10:35","6/7/2018 15:50"), "Animal_ID" = c(4,5,4,5,4,6), "Rock_ID" = c(1,2,1,3,4,5), x_proj = c(831120.3759,831441.0415,831120.3759,831433.4414,831128.4778,831422.0822), y_proj = c(5877582.998,5875337.074,5877582.998,5875328.897,5877575.360,5875338.216))

#make a separate object for the coordinates#
xy <- mydf[,c(5,6)]

#Convert to a spatialpoints data frame (insert own epsg)
sp.mydf <- SpatialPointsDataFrame(coords = xy, data = tumbling_test, proj4string = CRS("+init=epsg:xxxxx"))

I хочу, чтобы мои новые сгенерированные координаты все еще содержали данные атрибутов из других столбцов (например, Animal_ID, date и т. д. c), потому что другие методы, которые я использовал в ArcGIS, генерируют серию новых случайных точек, но я не могу сопоставить их с атрибутов.

Также, если есть способ добавить джиттер только к точкам, имеющим более одного вхождения в скалу, это было бы аккуратно. Например, здесь мне нужно только добавить джиттер в строки 1 и 3, потому что другие координаты не повторяются. Как только джиттер добавлен, я хочу преобразовать результаты обратно в обычный фрейм данных, который я экспортирую в .csv

1 Ответ

2 голосов
/ 12 января 2020

Да, и это намного проще, если вы работаете с sf-объектом.

Вам также нужно немного покопаться в системах координат координат (CRS), чтобы расставить точки на правильном расстоянии.

Если вы начинаете с пространственной точки данных, используйте st_as_sf() для возврата объекта sf.

Ниже приведен воспроизводимый пример с точками, сброшенными на расстояние около 5 км. Дрожание несколько случайное и в этом примере варьируется от ~ 2-5,5 километров.

library(sf)
#> Linking to GEOS 3.6.2, GDAL 2.2.3, PROJ 4.9.3
library(tidyverse)

# load example data
nc <- read_sf(system.file('gpkg/nc.gpkg', package = 'sf'))

#make single points from polygons
nc_points <- st_centroid(nc)
#> Warning in st_centroid.sf(nc): st_centroid assumes attributes are constant over
#> geometries of x
#> Warning in st_centroid.sfc(st_geometry(x), of_largest_polygon =
#> of_largest_polygon): st_centroid does not give correct centroids for longitude/
#> latitude data

# Transform to a crs that uses meters as the distance
nc_points <- st_transform(nc_points, 3358)

nc_points_jittered <- st_jitter(nc_points, amount = 5000)

p1 <- ggplot(nc_points) + 
  geom_sf() + 
  ggtitle('Original')

p2 <- ggplot(nc_points_jittered) + 
  geom_sf() + 
  ggtitle('Jittered')

p3 <- ggplot() + 
  geom_sf(data = nc_points, color = 'red') + 
  geom_sf(data = nc_points_jittered, color = 'black') + 
  ggtitle('Both')

cowplot::plot_grid(p1, p2, p3, ncol = 1)

Создано в 2020-01-12 с помощью Представить пакет (v0.3.0)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...