как отобразить имя соответствующего ПК при использовании prcomp для PCA в r - PullRequest
0 голосов
/ 14 октября 2019

Я использую prcomp для запуска PCA в r. Когда я выводю сводку, то есть стандартное отклонение, пропорцию дисперсии, совокупную пропорцию, результаты всегда упорядочиваются, а фактическое имя столбца заменяется на PC1, PC2. Таким образом, я не могу сказать точную пропорцию дисперсии для каждого столбца.

Может кто-нибудь показать мне или подсказать, как отображать столбец при выводе сводных результатов? Большое спасибо. (Два изображения результатов прилагаются здесь) enter image description here enter image description here

1 Ответ

0 голосов
/ 14 октября 2019

Не ясно, что вы понимаете, что делают основные компоненты. Это уменьшает размерность данных. Предполагая, что строки - это наблюдения, а столбцы - переменные, представьте, как вы строите свои строки в 35 измерениях (столбцах). Большинству людей трудно визуализировать более 3-х измерений. Основные компоненты создают меньший набор осей, который объясняет большинство изменений в данных. Оси евклидовы, что означает, что они находятся под прямым углом друг к другу. Ваш график и результат функций summary(res.pca5) и plot(res.pca5) показывают, что первое измерение объясняет 28% изменений в 35 переменных. Добавление второго измерения дает вам почти 38%, а три дает 44%. Эти новые переменные являются комбинациями ваших исходных переменных, а не исходных переменных. Первые два компонента объясняют больше изменчивости, чем любая другая комбинация.

По какой-то причине вы не использовали res.pca5 в качестве команды (или эквивалент print(res.pca5)), которая показала бы вам коэффициенты, которые pca использовала для создания компонентов из исходных переменных, или biplot(res.pca5), которая отображаетстроки и столбцы в новом двухмерном пространстве.

...