Представление результатов PCA относительно переменных на диаграмме рассеяния - PullRequest
0 голосов
/ 09 апреля 2019

Я делаю анализ основных компонентов большого набора данных (14 переменных, 2500 наблюдений) с целью выяснения корреляций между переменными. Я использую библиотеку FactoMineR. На данный момент я просто использую эту строку кода:

plot.PCA(X2.PCA,axes=c(1,3),unselect=1,choix="var" ,lim.cos2.var =0.5,  autolab="yes" )

где X2.PCA - результат моего анализа PCA. Чтобы проверить корреляции, я вручную изменяю значения в переменной axes, ведь это утомительно. Я хотел бы представить все графики PCA в простой диаграмме рассеяния. Я попробовал следующее:

pairs(X2.PCA$var$cor,upper.panel=NULL)

Но это не дает те же графики, что и plot.PCA, и я немного зашел в тупик, чтобы улучшить его. Может ли кто-нибудь показать мне лучший способ изобразить весь мой график? PCA-графики?

Вот 20 первых строк моего набора данных:

X2 <-структура (список (CO2_Lounge = c (11.2049941666667, 12.2042366666667, </p>)

6.76906, 11.03748250025, 12.6510383333333, 12.6775925, 13.0000608333333, 13.6306966666667, 8.697645, 6.59521333333333, 11.5527725, 11.6418625, 10,3574658333333, 10,4998775, 7,97028416666667, 11,540345, 11,4443291666667, 12.2817125, 9.51236, 7.06556833333333), RH_Ext = c (8.30166666666667, 8.23433333333333, 8.28441666666667, 8.55283333333333, 7.72633333333333, 7.77083333333333, 8.20058333333333, 8.4955, 8.54416666666667, 8,72533333333333, 8,81558333333333, 7,64041666666667, 7,24775, 7.22408333333333, 7.4675, 7.96825, 7.90991666666667, 8.10833333333333, 7.9985, 7.90133333333333), Temp_Ext = c (6.315, 6.125, 6.10333333333333, 6,1125, 6,35916666666667, 6,11083333333333, 5,5025, 5,0875, 5,02333333333333, 5.01666666666667, 5.81833333333333, 11.045, 11.5866666666667, 11,5366666666667, 10,6383333333333, 9,3825, 9,6775, 8,7275, 8,73166666666667, 8,86333333333333), MVHR_Sup_RH = c (6,30316666666667, 6,43075, 6.07666666666667, 6.45391666666667, 5.54908333333333, 5.60091666666667, 5.27175, 5.49183333333333, 5.53658333333333, 5.81375, 6.30241666666667, 6.01791666666667, 6.042, 6.11508333333333, 5.73941666666667, 5.87225, 6.13083333333333, 6.29066666666667, 6.20125, 6.38491666666667), MVHR_Sup_Temp = c (22.4733333333333, 22.4016666666667, +21,8633333333333, 21.5675, 24.3808333333333, 24.0341666666667, 24.2133333333333, 23,5108333333333, 23,1733333333333, 22,7741666666667, 22,2175, 21,6883333333333, 21,625, 21,5441666666667, 21,2758333333333, 20,9891666666667, 20,945, 20,9833333333333, 20,8458333333333, 20.0966666666667), RH_Bed = c (7.04791666666667, 7.187, 7.15883333333333, 7.04916666666667, 6.91641666666667, 6.86725, 6.86, 6.83366666666667, 7.15516666666667, 7.15858333333333, 7.16416666666667, 6.62466666666667, 6.22441666666667, 6.07291666666667, 5.83141666666667, 6.35733333333333, 6.4435, 6.71916666666667, 6.965, 7.17441666666667), Temp_Bed = c (22.0466666666667, 21,95, 21,5733333333333, 21,3016666666667, 21,795, 22,0641666666667, 22.0341666666667, 21.8033333333333, 22.0308333333333, 22.175, 21,8333333333333, 20,8741666666667, 20,6475, 20,4716666666667, 19,8658333333333, 19,8841666666667, 19,9516666666667, 20,165, 20.2558333333333, 19.8791666666667), RH_Lounge = c (5.28233333333333, 5,37475, 5,00816666666667, 5,45675, 5,27658333333333, 5,2095, 5.18416666666667, 5.07325, 4.79691666666667, 4.689, 5.12458333333333, 5.5205, 5.516, 5.49433333333333, 5.27533333333333, 5.4145, 5.48558333333333, 5,69675, 5,56591666666667, 5,48875), Temp_Lounge = c (22,5275, 22.0525, 20.985, 21.4066666666667, 25.015, 24.8241666666667, 24,5533333333333, 24,3766666666667, 23,3425, 22,5308333333333, 22.1216666666667, 22.3766666666667, 22.1741666666667, 22.1816666666667, 21.445, 22.1216666666667, 22.025, 22.9666666666667, 22.3591666666667, 21.145), Delta_Elec_Mains = c (8.77, 5.25, 4.4, 5.2, 4.38, 4.74, 4,85, 4,91, 2,94, 2,78, 6,22, 7,44, 4,59, 4,6, 5,55, 8,09, 15,65,3.1, 2.91, 3.42), MVHR_Delta_elec = c (9, 8, 9, 8, 9, 9, 8, 9, 9, 8, 9, 8, 9, 8, 8, 9, 9, 9, 8, 9), Delta_PV = c (0,01, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 2,83, 2,91, 1,93, 0,01, 0, 0, 0, 0, 0), Delta_Water = c(2,8, 2,4, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,1, 0,2, 0,4, 0,6, 1,2, 3,1, 0,4, 0, 0), Delta_Gas = c (0,5, 0,0,4, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,06, 0,24, 0,3, 0, 0,5, 0, 0, 0)), row.names = c (13050L, 13051L, 13054L,13055L, 13058L, 13059L, 13060L, 13062L, 13063L, 13064L, 13098L, 13118L, 13119L, 13120L, 13122L, 13125L, 13126L, 13132L, 13133L, 13150L), класс = "data.frame")

Спасибо

...