Создание кластеров с использованием корреляционной матрицы в Python - PullRequest
0 голосов
/ 13 октября 2018

все, у меня есть корреляционная матрица из 21 сектора промышленности.Теперь я хочу разделить эти 21 сектор на 4 или 5 групп, сгруппированные секторы с одинаковым поведением.

Могут ли эксперты пролить свет на то, как это сделать в Python, пожалуйста?Большое спасибо заранее!

1 Ответ

0 голосов
/ 13 октября 2018

Вы можете изучить использование Pandas DataFrame.corr и scipy.cluster Пакет иерархической кластеризации

import pandas as pd
import scipy.cluster.hierarchy as spc


df = pd.DataFrame(my_data)
corr = df.corr().values

pdist = spc.distance.pdist(corr)
linkage = spc.linkage(pdist, method='complete')
idx = spc.fcluster(linkage, 0.5 * pdist.max(), 'distance')
...