Предполагает ли sklearn DBSCAN, что расстояния нормализованы? - PullRequest
0 голосов
/ 02 апреля 2020

Я изучаю DBSCAN, и, по-видимому, наиболее важным гиперпараметром является eps из документации по sklearn:

eps float, по умолчанию = 0,5

  • максимальное расстояние между двумя образцами для одного, которое должно рассматриваться как соседство с другим.
  • Это не максимальная граница расстояний между точками в кластере.
  • Это наиболее важный параметр DBSCAN, который необходимо правильно выбрать для вашего набора данных и функции расстояния.

Я заметил, что число 0,5 фактически не принимает диапазон расстояний другими словами, если я буду использовать расстояния от 1 до 100, будет ли он работать так же, если я увеличу эти расстояния в 100 раз? Или уменьшить в 10 раз? Или этот параметр предполагается использовать на нормализованных расстояниях (max_distance = 1)?

...