Как сделать плотность кластеризации геоданных? - PullRequest
0 голосов
/ 29 июня 2018

Я хотел бы кластеризовать геоданные (координаты, высота как минимум), используя алгоритм на основе плотности. Я обнаружил, что DBSCAN должен работать довольно хорошо для моих целей. Я хочу иметь даже небольшие отдельные кластеры с minpts 1 или 2. Это делает работу, но оставляет другие точки как один огромный кластер или шум, и я хочу, чтобы они также были сгруппированы в более мелкие группы.

Например, если у меня есть две группы вершин (например, горы), расположенные в разных местах на карте, я хочу, чтобы они были в двух отдельных кластерах. Как этого добиться? Может быть, как-то установить максимальное количество очков в алгоритме? Я ценю любой совет.

P.S. Я использовал R для этой цели, но вопрос больше в подходе.

1 Ответ

0 голосов
/ 30 июня 2018

Не используйте слишком маленькие чеканки.

1 или 2 балла не являются "кластерами". Эти точки являются «шумом». Просто обрабатывайте все точки шума как отдельные кластеры или соединяйте их на достаточно коротком расстоянии, если вы действительно этого хотите. Вы можете легко обработать шум.

Но для целей плотность базовая кластеризация вам нужно больше очков, чтобы иметь плотность . Фактически, для минут до 2 DBSCAN вырождается в одноканальную кластеризацию.

...