Я пытаюсь определить самые высокие значения корреляции среди независимых переменных (например,> = 0,8 | <= -0,8) и затем исключаю <strong>независимую переменную, которая имеет самое низкое значение корреляции с зависимая переменная, чтобы избежать мультиколлинеарности в линейных моделях.
Сначала я хотел бы определить самые высокие корреляции между независимыми переменными, а затем исключить те, которые имеют самые низкие корреляции с зависимой переменной, которая находится в первой строке и столбец с именем EC1
Набор данных, если вы хотите его запустить
cor_26_EC<-rcorr(x=as.matrix(data_26_EM[c(4,8:length(data_26_EM))]),type="pearson")
cor_test<-(cor_26_EC$r)
> head(cor_test)
EC1 DEM slope aspect northernness plan_curv prof_curv convergence twi
EC1 1.0000000 -0.68580505 0.36444948 -0.17735481 0.17735481 -0.14541592 -0.21159663 -0.10027208 -0.10220409
DEM -0.6858051 1.00000000 -0.47325220 0.06090698 -0.06090698 0.28021257 0.34739247 0.24297883 -0.02919072
slope 0.3644495 -0.47325220 1.00000000 -0.02321129 0.02321129 0.04219001 0.01703231 0.03937512 -0.56400210
aspect -0.1773548 0.06090698 -0.02321129 1.00000000 -1.00000000 -0.01574986 -0.01260762 0.04838931 0.02877949
northernness 0.1773548 -0.06090698 0.02321129 -1.00000000 1.00000000 0.01574986 0.01260762 -0.04838931 -0.02877949
plan_curv -0.1454159 0.28021257 0.04219001 -0.01574986 0.01574986 1.00000000 0.59109001 0.73023077 -0.51818538
(it continues...)