Позитивная корреляционная кластеризация - PullRequest
1 голос
/ 26 мая 2019

Я применил иерархическую кластеризацию к корреляционной матрице моего фрейма данных df следующим образом:

import scipy.cluster.hierarchy as sch

X = df.corr().values
d = sch.distance.pdist(X) 
L = sch.linkage(d, method='complete')
C = sch.fcluster(L, 0.5*d.max(), 'distance')

Как я могу настроить это так, чтобы отрицательные корреляции рассматривались как «плохие»? Я собираюсь кластеризовать мои переменные на основании того, насколько положительно коррелирует их. Надеюсь, вопрос имеет смысл:)

...