Точки кластеризации, когда не все точки находятся в кластере - PullRequest
0 голосов
/ 27 января 2019

У меня есть группа координат, приведенная ниже.Я хотел бы сгруппировать перекрывающиеся точки (точки, обведенные красным), однако я бы хотел, чтобы все остальные точки, которые не перекрываются (точки, не обведенные красным), игнорировались.Я не могу использовать кластеризацию K-средних, так как это объединит все точки, включая те, которые я хочу игнорировать.Мне было интересно, как я могу пойти по этому поводу.Спасибо

Желаемый выход:

enter image description here

Ввод:

enter image description here

1 Ответ

0 голосов
/ 01 февраля 2019

Существует не просто k-средних.Вам не хватает 50 лет исследований, если все, что вы считаете, это k-средних.

Например, в DBACAN есть концепция точек шума, которые не относятся ни к одному кластеру.

В вашем случае,однако на самом деле вы не ищете кластеризацию.

Вместо этого вы хотите выполнить самоподключение по подобию.Потому что, насколько я могу судить.Вы хотите сопоставить пар баллов.Это особый вид соединения.Для этого нет стандартного синтаксиса, но думайте об этом как SELECT a.p, b.p FROM data AS a JOIN data AS b WHERE distance(a.p, b.p) < threshold.

...