Как интерпретировать результат функции hclustvar пакета ClustOfVar в R для выбора функции? - PullRequest
0 голосов
/ 29 марта 2019

Я использую иерархический кластерный анализ для кластеризации переменных Pima Indian Diabetes набор данных. Я сделаю выбор функции на основе кластерного анализа. Я знаю, что могу построить дендрограмму и увидеть похожий тип функций. Но это будет своего рода произвольный выбор. Я хочу сделать больше научных. Когда я проверяю результат, появляется список, который состоит из нескольких списков, и каждый список имеет несколько номеров. В списках g и s разные числа для одинаковых переменных. Также есть векторы X, Y, Z и W. Я приложил скриншот результата. Что представляют собой эти цифры? Могу ли я получить какие-либо сведения из этих чисел о значении переменных для выбора?

df <- read_excel("excel file path")
str(df)
X <- subset(df, select = -Outcome)
X <- data.frame(apply(X, 2, as.numeric))
tree <- hclustvar(X)
plot(tree)

enter image description here

...