У меня есть набор данных, состоящий из 132 наблюдений и 10 переменных.Эти переменные являются категориальными.Я пытаюсь увидеть, как мои наблюдения кластеризуются и насколько они различаются в зависимости от процентного отклонения.т.е. я хочу выяснить, есть ли а) какие-либо переменные, которые помогают отделить определенные точки наблюдения друг от друга, и б) если да, какой процент дисперсии объясняется этим?
Мне посоветовали провести PCoA (Принципный анализ координат) на моих данных.Я запустил его, используя веганский и пакет обезьян.Это мой код после загрузки моего CSV-файла в r, я называю его данными
#data.dis<-vegdist(data,method="gower",na.rm=TRUE)
#data.pcoa<-pcoa(data.dis)
Затем мне сказали извлечь векторы из данных pcoa и поэтому
#data.pcoa$vectors
Затемвернул мне 132 строки, но 20 столбцов значений (например, от оси 1 до оси 20)
Я был озадачен, почему было 20 столбцов значений, когда у меня только 10 переменных.У меня сложилось впечатление, что я получу только 10 столбцов.Если какие-то добрые души могут помочь объяснить а) что на самом деле представляют векторы и б) как я могу получить процент дисперсии, объясненный осями 1 и 2?
Еще один вопрос, который у меня возник, был: я не совсем понимаю цель извлечения собственных значений из data.pcoa
, потому что я видел, как некоторые веб-сайты делают это после запуска pcoa на их матрице расстояний, но дальнейших объяснений не былоЭто.