изменение порядка кластеров для k означает результат - PullRequest
0 голосов
/ 26 апреля 2020

Я запускаю ak означает испытание в R (kmeans()) по двум атрибутам, измеренным для списка образцов. Что-то вроде этого: df<-data.frame(Sample=c("S1","S2","S3","S4","S5"),VarA=scale(sample(1:10,5,replace = T)),VarB=scale(sample(runif(5)))) Переменные масштабируются для функции kmeans(). На основе fviz_nbclust() в пакете EnvStats я делю его на 3 кластера, затем запускаю VarAK<-kmeans(df$VarA,3,nstart = 25) и VarBK<-kmeans(df$VarB,3,nstart = 25). Моя цель - запустить тест Фишера и проверить, коррелируют ли эти две переменные. Моя проблема в том, что когда я запускаю тест для каждой переменной, кластеры не совпадают. Для VarA кластеры 1 = самый высокий и 3 = самый низкий, а для VarB кластеры 1 = самый низкий и 2 = самый высокий. Любые идеи о том, как установить порядок кластеров? Спасибо

...