Для больших наборов данных в Python как найти ближайшее местоположение, используя долготу и широту? - PullRequest
0 голосов
/ 25 февраля 2020

У меня есть pandas кадр данных, содержащий 500.000 (!) Строк (местоположений) и два столбца:

  • Долгота
  • Широта

Теперь я хочу третий столбец:

  • Ближайшее местоположение

В этом столбце должно быть указано, какая строка / местоположение является ближайшей к текущей строке / location.

Я знаю, что вы можете найти расстояние между двумя lon / lat, используя, например, cdist из scipy.spatial.distance. Тем не менее, это занимает слишком много времени, так как оно должно l oop через набор данных 500.000 * 500.000 раз (потому что он пытается найти расстояние до каждого местоположения, для каждого местоположения).

Кто-нибудь знает, как с этим справиться?

...