Я изучаю DBSCAN, и, по-видимому, наиболее важным гиперпараметром является eps из документации по sklearn:
eps float, по умолчанию = 0,5
- максимальное расстояние между двумя образцами для одного, которое должно рассматриваться как соседство с другим.
- Это не максимальная граница расстояний между точками в кластере.
- Это наиболее важный параметр DBSCAN, который необходимо правильно выбрать для вашего набора данных и функции расстояния.
Я заметил, что число 0,5 фактически не принимает диапазон расстояний другими словами, если я буду использовать расстояния от 1 до 100, будет ли он работать так же, если я увеличу эти расстояния в 100 раз? Или уменьшить в 10 раз? Или этот параметр предполагается использовать на нормализованных расстояниях (max_distance = 1
)?