Существует не просто k-средних.Вам не хватает 50 лет исследований, если все, что вы считаете, это k-средних.
Например, в DBACAN есть концепция точек шума, которые не относятся ни к одному кластеру.
В вашем случае,однако на самом деле вы не ищете кластеризацию.
Вместо этого вы хотите выполнить самоподключение по подобию.Потому что, насколько я могу судить.Вы хотите сопоставить пар баллов.Это особый вид соединения.Для этого нет стандартного синтаксиса, но думайте об этом как SELECT a.p, b.p FROM data AS a JOIN data AS b WHERE distance(a.p, b.p) < threshold
.