У меня есть pandas кадр данных, содержащий 500.000 (!) Строк (местоположений) и два столбца:
Теперь я хочу третий столбец:
В этом столбце должно быть указано, какая строка / местоположение является ближайшей к текущей строке / location.
Я знаю, что вы можете найти расстояние между двумя lon / lat, используя, например, cdist
из scipy.spatial.distance
. Тем не менее, это занимает слишком много времени, так как оно должно l oop через набор данных 500.000 * 500.000 раз (потому что он пытается найти расстояние до каждого местоположения, для каждого местоположения).
Кто-нибудь знает, как с этим справиться?