Python: начало работы с кластеризацией - PullRequest
0 голосов
/ 28 января 2019

Я пытаюсь понять, что делает эта функция связи в модуле кластеризации иерархии Python (не удалось понять из документации или других более сложных вопросов).

Я попробовал пример со случайным вектором,Я не знаю, с чего начать выяснять, что это делает, почему в связке 12 чисел и что они?

Спасибо

dist_vec=np.random.randint(1,10,6)
print dist_vec
[4 2 2 6 5 1]

# create linkage
Z = linkage(dist_vec, method='single')

# distance = 0.8 as cutoff
clusters = fcluster(Z, 0.8, criterion='distance')

print Z
[[ 2.  3.  1.  2.]
[ 0.  4.  2.  3.]
[ 1.  5.  4.  4.]]

1 Ответ

0 голосов
/ 01 февраля 2019

Формат вывода поясняется в документации scipy.

Это два идентификатора кластера, высота и количество точек.

Я настоятельно рекомендую начать с 2d евклидовых игрушечных данных.Не случайная матрица расстояний (которая будет противоречивой).

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...