Как кластеризовать * функции * на основе их корреляции друг с другом с помощью склеринга k-средних - PullRequest
0 голосов
/ 02 октября 2018

У меня есть кадр данных pandas со строками в виде записей (пациенты) и 105 столбцами в качестве элементов (свойства каждого пациента).но столбцы, чтобы я мог видеть, какие функции похожи или связаны с какими другими функциями.Я уже могу рассчитать корреляцию каждой функции с любой другой функцией, используя df.corr().Но как я могу сгруппировать их в k = 2,3,4 ... групп, используя sklearn.cluster.KMeans?

Я пытался KMeans(n_clusters=2).fit(df.T), который объединяет функции (потому что я взял транспонирование матрицы), нотолько с евклидовой функцией расстояния, а не в соответствии с их корреляциями.Я предпочитаю кластеризовать функции в соответствии с соотношениями.

Это должно быть очень легко, но я был бы признателен за вашу помощь.

...