Как правило, вы захотите вставить по крайней мере ваши точечные данные в хранилище данных GeoMesa, которое затем можно запросить на основе пространственных предикатов, чтобы эффективно отфильтровать те, которые вас интересуют.
GeoMesa имеетнесколько различных вариантов хранения данных, которые вы можете использовать, от полностью распределенной базы данных, такой как HBase, до облегченного решения на основе файловой системы.Лучший будет зависеть от ваших требований к производительности и доступной инфраструктуры.Более подробная информация о различных хранилищах данных здесь и специфических для Spark деталях здесь .
После того, как вы получили данные, вы можете попробовать один из подходов к объединениюв общих чертах здесь или здесь , в зависимости от размера вашего участка дороги RDD.