Чтобы указать, почему они находятся в одном кластере, позвольте мне дать вам общее объяснение того, что делает DBSCAN.
- Построить график, соединив точки данных
- Измерение размера каждого подключенного компонента
- Отменить компоненты, которые меньше порогового значения, которое в
sklearn
является параметром min_sample
.
esp
контролирует максимальное расстояние, для которого вы соединяете две точки данных. Для вашего набора данных с обозначением [a-b], обозначающим соединения, у вас есть:
[9-11], [11-13], [13-14], [14-15]
Таким образом, все эти точки находятся в одном компоненте, и этот компонент больше, чем ваш min_sample
параметр, поэтому он считается допустимым кластером.