Нахождение кластеров с максимальным внутренним расстоянием на основе гео-координат - PullRequest
0 голосов
/ 28 января 2019

У меня есть DataSet, который содержит данные Lat long.

('ID','Latitude','Longitude')

('A0001',19.222,71.555)

Используя эти данные, я вычислил матрицу расстояний, где M [i] [j] - расстояние между ID: i и ID: j.

Расстояние вычисляется с использованием приведенного ниже кода:

geopy.distance.vincenty((a,b),(c,d)).miles

Существует ли лучший способ найти кластеры, которые находятся в пределах X миль от радиуса.

Большинство изтекущие кластеры, такие как «DBSCAN» K-Means, предоставляют опции для минимального расстояния и минимальной выборки, однако я ищу метод кластеризации, который обеспечивает максимальное расстояние.

Во-вторых, я в порядке, чтобы не вычислять матрицу расстояний, если это такне требуется.

1 Ответ

0 голосов
/ 31 января 2019

Выполните иерархическую кластеризацию связей.

Если вы разрежете дерево на расстоянии x, любые две точки в одном кластере будут иметь расстояние не более x.Это не оптимально (потому что это будет NP завершено), но достаточно хорошо, обычно.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...