У меня есть кадр данных pandas со строками в виде записей (пациенты) и 105 столбцами в качестве элементов (свойства каждого пациента).но столбцы, чтобы я мог видеть, какие функции похожи или связаны с какими другими функциями.Я уже могу рассчитать корреляцию каждой функции с любой другой функцией, используя df.corr()
.Но как я могу сгруппировать их в k = 2,3,4 ... групп, используя sklearn.cluster.KMeans
?
Я пытался KMeans(n_clusters=2).fit(df.T)
, который объединяет функции (потому что я взял транспонирование матрицы), нотолько с евклидовой функцией расстояния, а не в соответствии с их корреляциями.Я предпочитаю кластеризовать функции в соответствии с соотношениями.
Это должно быть очень легко, но я был бы признателен за вашу помощь.