У меня есть 2 набора точек, set1
и set2
. Оба набора точек имеют данные, связанные с этой точкой. Точки в наборе 1 являются «эфемерными» и существуют только на указанную дату. Точки в наборе 2 являются «постоянными», создаются на определенную дату, а затем существуют навсегда после этой даты.
set.seed(1)
dates <- seq(as.Date('2011-01-01'),as.Date('2011-12-31'),by='days')
set1 <- data.frame(lat=40+runif(10000),
lon=-70+runif(10000),date=sample(dates,10000,replace=TRUE))
set2 <- data.frame(lat=40+runif(100),
lon=-70+runif(100),date=sample(dates,100,replace=TRUE))
Вот моя проблема: для каждой точки в set1 (эфемерной) найдите расстояние до ближайшей точки в set2 (постоянной), которая была построена ДО того, как событие set1 произошло. Например, 1-я точка в set1 произошла 2011-03-18:
> set1[1,]
lat lon date
1 40.26551 -69.93529 2011-03-18
Итак, я хочу найти ближайшую точку в set2, которая была построена до 2011-03-18:
> head(set2[set2$date<=as.Date('2011-04-08'),])
lat lon date
1 40.41531 -69.25765 2011-02-18
7 40.24690 -69.29812 2011-02-19
13 40.10250 -69.52515 2011-02-12
14 40.53675 -69.28134 2011-02-27
17 40.66236 -69.07396 2011-02-17
20 40.67351 -69.88217 2011-01-04
Дополнительная складка в том, что это точки широты / долготы, поэтому я должен рассчитать расстояния вдоль поверхности земли. Пакет R поля предоставляет удобную функцию для этого:
require(fields)
distMatrix <- rdist.earth(set1[,c('lon','lat')],
set2[,c('lon','lat')], miles = TRUE)
Мой вопрос: как я могу отрегулировать расстояния в этой матрице до Inf
, если точка в set2 (столбец матрицы расстояний) была построена после точки в set1 (матрица строк расстояний)?