У меня есть следующее в кадре данных pandas:
z | x | y | hash
_________________
a | 0.0 | 1.0 | abcd
b | 1.0 | 1.0 | efghj
c | 1.0 | 0.0 | iklmno
d | 0.0 | 0.0 | pqrs
(где Z представляет цифровую высоту, x и y - широта, долгота, а ha sh - геоха sh)
Чтобы найти ближайшие n местоположений geoha sh, я хотел бы преобразовать его в массив 2d numpy, чтобы местоположение сохранялось в структуре массива:
[["pqrs","abcd"],
["iklmno","efghj"]]
Исходный фрейм данных имеет длину более 2 000 000 записей и является результатом геохеширования растра, имеющего форму (7875, 14644).
В процессе геохеширования была потеряна некоторая информация, поэтому я не могу просто преобразовать фрейм данных в массив numpy и использовать numpy.reshape()
. Я пробовал решения, включающие numpy.meshgrid()
(как описано Здесь ), но в моей системе недостаточно памяти для хранения объектов сетки.
Я также пробовал растеризовать фрейм данных с помощью «r», но это привело к сбою моей системы.
Любой совет был бы чрезвычайно полезен! Спасибо сообществу SO