В модуле scipy кластеризации есть множество вариантов , и я хотел бы убедиться, что я правильно их использую.У меня есть симметричная матрица расстояний DR
, и я хотел бы найти все кластеры так, чтобы любая точка в кластере имела соседа с расстоянием не более 1,2.
L = linkage(DR,method='single')
F = fcluster(L, 1.2)
В linkage
я почти уверен, что single
- это то, что я хочу (алгоритм ближайшей точки).Однако для fcluster
я думаю Мне нужен метод по умолчанию, «несовместимый», метод:
«несогласованный»: если узел кластера и все его потомки имеют несовместимое значениеменьше или равно t, тогда все его потомки листьев принадлежат одному и тому же плоскому кластеру.Когда ни один не одноэлементный кластер не соответствует этому критерию, каждый узел назначается своему кластеру.(По умолчанию)
Но, возможно, это метод «расстояния»:
«расстояние»: формирует плоские скопления, так что исходные наблюдения в каждом плоском скоплении не имеют большеКопенетическое расстояние, чем т.
... Я не уверен.Какой использовать?Что в данном контексте означает копенетическое расстояние?