Я запускаю ak означает испытание в R (kmeans()
) по двум атрибутам, измеренным для списка образцов. Что-то вроде этого: df<-data.frame(Sample=c("S1","S2","S3","S4","S5"),VarA=scale(sample(1:10,5,replace = T)),VarB=scale(sample(runif(5))))
Переменные масштабируются для функции kmeans()
. На основе fviz_nbclust()
в пакете EnvStats
я делю его на 3 кластера, затем запускаю VarAK<-kmeans(df$VarA,3,nstart = 25)
и VarBK<-kmeans(df$VarB,3,nstart = 25)
. Моя цель - запустить тест Фишера и проверить, коррелируют ли эти две переменные. Моя проблема в том, что когда я запускаю тест для каждой переменной, кластеры не совпадают. Для VarA кластеры 1 = самый высокий и 3 = самый низкий, а для VarB кластеры 1 = самый низкий и 2 = самый высокий. Любые идеи о том, как установить порядок кластеров? Спасибо