У меня возникли некоторые проблемы при интерпретации результатов prcomp()
.
Допустим, у меня есть центрированная и масштабированная таблица данных, называемая dat, с N столбцами и M строками.Действительно, каждый столбец представляет особенность, а каждая строка - запись.Я также получил M-мерный вектор результатов Y
.
Я хотел знать, что говорит PCA этой системы.Поэтому я только что выполнил:
dat.pca=prcomp(dat,retx=TRUE)
По методу локтя я решил сохранить 5 режимов PCA, что составляет 90% дисперсии.Затем я получил следующее data.table
:
dat.pcadata=as.data.table(dat.pca$x)
dat.pcadata
имеет M строк и N столбцов, и каждый столбец соответствует режиму PCA.
У меня вопрос: могу ли яправильно понимать, если я скажу, что теперь моя система должна быть обучена прогнозировать результаты Y, используя первые 5 столбцов dat.pcadata
в качестве признаков?