Как запустить иерархическую кластеризацию на корреляционной матрице в scipy
/ numpy
? У меня есть матрица из 100 строк на 9 столбцов, и я хотел бы иерархически кластеризовать по корреляции каждой записи по 9 условиям. Я хотел бы использовать 1-корреляцию Пирсона в качестве расстояния для кластеризации. Предполагая, что у меня есть numpy
массив X
, который содержит матрицу 100 x 9, как я могу это сделать?
Я пытался использовать hcluster, основываясь на этом примере:
Y=pdist(X, 'seuclidean')
Z=linkage(Y, 'single')
dendrogram(Z, color_threshold=0)
Однако, pdist
- это не то, что я хочу, так как это евклидово расстояние. Есть идеи?
спасибо.