Найти ближайший набор координат в командной строке - PullRequest
0 голосов
/ 30 апреля 2018

Я ищу решение командной строки, чтобы найти ближайшие наборы точек из списка координат CSV.

Здесь это ответ для Excel, но мне нужно несколько иное решение.

Я НЕ ищу ближайшую точку для каждой точки, но для пар точек с наименьшим расстоянием друг от друга.

Я бы хотел сопоставить многие электростанции от GEO, так что инструмент командной строки (python?) Был бы великолепен.

Вот пример набора данных:

Chicoasén Dam,16.941064,-93.100828
Tuxpan Oil Power Plant,21.014891,-97.334492
Petacalco Coal Power Plant,17.983575,-102.115252
Angostura Dam,16.401226,-92.778926
Tula Oil Power Plant,20.055825,-99.276857
Carbon II Coal Power Plant,28.467176,-100.698559
Laguna Verde Nuclear Power Plant,19.719095,-96.406347
Carbón I Coal Power Plant,28.485238,-100.69096
Manzanillo I Oil Power Plant,19.027372,-104.319274
Tamazunchale Gas Power Plant,21.311282,-98.756266

Инструмент должен печатать "Carbon II" и "Carbon I", потому что эта пара имеет минимальное расстояние.

Фрагмент кода может быть:

from math import radians, cos, sin, asin, sqrt
import csv

def haversine(lon1, lat1, lon2, lat2):
    # convert decimal degrees to radians
    lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2])

    # haversine formula 
    dlon = lon2 - lon1 
    dlat = lat2 - lat1 
    a = sin(dlat/2)**2 + cos(lat1) * cos(lat2) * sin(dlon/2)**2
    c = 2 * asin(sqrt(a)) 

    km = 6371 * c
    return km 

with open('mexico-test.csv', newline='') as csvfile:
    so = csv.reader(csvfile, delimiter=',', quotechar='|')
    data = []
    for row in so:
        data.append(row)

print(haversine(28.467176,-100.698559,28.485238,-100.69096))

1 Ответ

0 голосов
/ 01 мая 2018

Простой метод состоит в том, чтобы вычислить все пары, а затем найти минимальную пару, где «размер» пары определяется как расстояние между двумя точками в паре:

from itertools import combinations

closest = min(combinations(data, 2),
              key=lambda p: haversine(float(p[0][1]), float(p[0][2]), float(p[1][1]), float(p[1][2])))

Чтобы получить пять самых маленьких, используйте кучу с тем же ключом.

import heap

pairs = list(combinations(data, 2))
heap.heapify(pairs)
five_smallest = heapq.nsmallest(
    5,
    combinations(data, 2),
    key=lambda p: haversine(float(p[0][1]), float(p[0][2]), float(p[1][1]), float(p[1][2])))
...