Я пытаюсь провести анализ главных компонентов дихотомических переменных (скрытой непрерывной шкалы) для лиц, принадлежащих к двум группам, чтобы увидеть, отличаются ли такие группы по основным компонентам.Поскольку под вашими двоичными данными есть скрытая непрерывная шкала, я использовал тетрахорическую корреляцию.Вот пример данных, с которыми я работаю
df <- data.frame(CMS_1 = sample(2, replace = T, size = 10)-1,
CMS_2 = sample(2, replace = T, size = 10)-1,
CMS_3 = sample(2, replace = T, size = 10)-1,
CMS_4 = sample(2, replace = T, size = 10)-1,
CMS_5 = sample(2, replace = T, size = 10)-1,
CMS_6 = sample(2, replace = T, size = 10)-1,
CMS_7 = sample(2, replace = T, size = 10)-1,
CMS_8 = sample(2, replace = T, size = 10)-1,
CMS_9 = sample(2, replace = T, size = 10)-1,
CMS_10 = sample(2, replace = T, size = 10)-1,
CMS_11 = sample(2, replace = T, size = 10)-1,
CMS_12 = sample(2, replace = T, size = 10)-1,
CMS_13 = sample(2, replace = T, size = 10)-1,
CMS_14 = sample(2, replace = T, size = 10)-1,
disease_status = sample(2, replace = T, size = 10)-1)
"CMS_1: CMS_14" - это дихотомические переменные, из которых я заинтересован в извлечении основных компонентов.«болезнь_статус» обозначает членство в группе, т.е. имеет ли заболевание субъект или нет.Вот код для получения главных компонентов из тетрахорической корреляционной матрицы.
library(psych)
library(factoextra)
library(FactoMineR)
df <- df %>% mutate_if(is.numeric, as.factor)
df_matrix<-data.matrix(df[,-15])
df_tetra<-tetrachoric(df_matrix)
res.pca <- PCA(df_tetra$rho, graph = FALSE)
Если я вставлю "res.pca", он говорит:
Результаты для анализа главных компонентов (PCA) Анализ был выполнен для 14 человек, описанных 14 переменными
Я заинтересован в извлечении результатов для людей, чтобы посмотреть, не входят ли группы, к которым такие люди, по-разному, в главные компоненты.Функции get_pca_ind () и fviz_pca_ind () из factoextra будут работать, если я передам исходный набор данных (df) в функцию PCA ().Однако, поскольку я использовал тетрахорическую корреляционную матрицу, тот же набор переменных (CMS_1: CSM_14) рассматривается как отдельные лица.Фактически, как я уже писал выше, проверка результатов PCA () на тетрахорической матрице корреляции приводит к следующему: анализ был проведен для 14 человек, описанных 14 переменными.Спасибо!