Анализ главных компонент дихотомических переменных - PullRequest
1 голос
/ 02 апреля 2019

Я пытаюсь провести анализ главных компонентов дихотомических переменных (скрытой непрерывной шкалы) для лиц, принадлежащих к двум группам, чтобы увидеть, отличаются ли такие группы по основным компонентам.Поскольку под вашими двоичными данными есть скрытая непрерывная шкала, я использовал тетрахорическую корреляцию.Вот пример данных, с которыми я работаю

df <- data.frame(CMS_1 = sample(2, replace = T, size = 10)-1,
              CMS_2 = sample(2, replace = T, size = 10)-1,
              CMS_3 = sample(2, replace = T, size = 10)-1,
              CMS_4 = sample(2, replace = T, size = 10)-1,
              CMS_5 = sample(2, replace = T, size = 10)-1,
              CMS_6 = sample(2, replace = T, size = 10)-1,
              CMS_7 = sample(2, replace = T, size = 10)-1,
              CMS_8 = sample(2, replace = T, size = 10)-1,
              CMS_9 = sample(2, replace = T, size = 10)-1,
              CMS_10 = sample(2, replace = T, size = 10)-1,
              CMS_11 = sample(2, replace = T, size = 10)-1,
              CMS_12 = sample(2, replace = T, size = 10)-1,
              CMS_13 = sample(2, replace = T, size = 10)-1,
              CMS_14 = sample(2, replace = T, size = 10)-1,
              disease_status = sample(2, replace = T, size = 10)-1)

"CMS_1: CMS_14" - это дихотомические переменные, из которых я заинтересован в извлечении основных компонентов.«болезнь_статус» обозначает членство в группе, т.е. имеет ли заболевание субъект или нет.Вот код для получения главных компонентов из тетрахорической корреляционной матрицы.

library(psych)

library(factoextra)

library(FactoMineR)

df <- df %>% mutate_if(is.numeric, as.factor)

df_matrix<-data.matrix(df[,-15])

df_tetra<-tetrachoric(df_matrix)

res.pca <- PCA(df_tetra$rho, graph = FALSE)

Если я вставлю "res.pca", он говорит:

Результаты для анализа главных компонентов (PCA) Анализ был выполнен для 14 человек, описанных 14 переменными

Я заинтересован в извлечении результатов для людей, чтобы посмотреть, не входят ли группы, к которым такие люди, по-разному, в главные компоненты.Функции get_pca_ind () и fviz_pca_ind () из factoextra будут работать, если я передам исходный набор данных (df) в функцию PCA ().Однако, поскольку я использовал тетрахорическую корреляционную матрицу, тот же набор переменных (CMS_1: CSM_14) рассматривается как отдельные лица.Фактически, как я уже писал выше, проверка результатов PCA () на тетрахорической матрице корреляции приводит к следующему: анализ был проведен для 14 человек, описанных 14 переменными.Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...