Я применил иерархическую кластеризацию к корреляционной матрице моего фрейма данных df
следующим образом:
import scipy.cluster.hierarchy as sch
X = df.corr().values
d = sch.distance.pdist(X)
L = sch.linkage(d, method='complete')
C = sch.fcluster(L, 0.5*d.max(), 'distance')
Как я могу настроить это так, чтобы отрицательные корреляции рассматривались как «плохие»? Я собираюсь кластеризовать мои переменные на основании того, насколько положительно коррелирует их. Надеюсь, вопрос имеет смысл:)