Включает ли радиус эпсилон в алгоритмы DBSCAN / OPTICS? - PullRequest
0 голосов
/ 22 января 2019

Оригинальная статья и другие ресурсы (википедия) всегда определяют базовый объект в зависимости от радиуса ε (должно быть более MinPts соседей), используя выражения типа в пределах или до .Это оставляет место для интерпретации, является ли этот радиус включительным или нет: является ли объект q соседом p, если расстояние (p, q) точно ε?

Это, очевидно, очень важно, поскольку все определения основанына этом ...

Ответы [ 2 ]

0 голосов
/ 23 января 2019

Определение в исходной dbscan бумаге для окрестности является dist (p, q) <= eps.Однако большинство реализаций будет использовать любой запрос диапазона, поддерживаемый индексом базы данных.В большинстве случаев это не будет иметь значения, и OmG прав, что добавление наименьшего представимого числа к eps эффективно изменит <на <=. </p>

0 голосов
/ 22 января 2019

Я думаю, что это вообще не важно. Поскольку существуют разные методы для определения значения epsilon, и ни один из них не является настолько точным, а также это зависит от структуры данных, которые вы кластеризуете.

Более того, если вы измените значение epsilon чуть больше, чем точность языка разработки на указанной работающей машине, эта проблема может быть решена, и они вообще не являются их соседями! Следовательно, из-за чувствительности этой проблемы к точности этой машины означает, что она не может играть жизненно важную роль в вашем конечном результате в большинстве общих случаев.

...