Это проблема, которую я только начинаю рассматривать как часть большого анализа пространственных данных, который я предпринимаю в связи с эффективностью охраняемых охраняемых территорий, поэтому данных или кода пока нет.
Я доволен хорошей частью моей методологии, и, хотя я относительно новичок в R, есть шаг I, который не знает, как писать сценарии и искать какие-либо советы в правильном направлении.
У меня будет большой набор данных, поступающий из пространственных точек, которые я получу из Arcgis (используя среду геопространственного моделирования), который будет состоять из 9 миллионов + точек данных, каждая со значениями для 5-7 связанных с ними переменных и значения расстояния махаланобисов между ними и другими точками данных для каждой переменной (рассчитывается с использованием пакета 'vegan' в R). Часть этих пикселей будет из защищенных областей, а остальная часть - из незащищенных областей.
Моя цель состоит в том, чтобы для каждого пикселя из защищенных областей (фокусный пиксель) я хотел определить 500 ближайших к нему соседей по всем переменным, включая как защищенные, так и незащищенные пиксели, образуя «набор сходства» для каждого из них. ,
Методология, которую я адаптирую для этого, рекомендует, чтобы для ускорения обработки, выполняемой на этом шаге, сначала была установлена sh граница подобия вокруг каждого фокусного пикселя, так что единственные пиксели, попадающие в это поле, должны были бы проверить, не составляют ли они 500 ближайших соседей, а не весь набор данных. В практическом плане все это означает фильтрацию всего набора данных для создания подмножества точек данных (пикселей), которые попадают в диапазон значений для каждого ковариата, а затем извлечение 500 ближайших совпадений из числа этих.
На данный момент я не знаю, как даже начать подходить к написанию сценария, чтобы сделать это, поэтому любая помощь, даже указание на похожие примеры, была бы очень полезна.
Спасибо, Бен.