Я изучаю влияние использования почвы / растительного покрова на несколько физико-химических параметров воды в 6 различных водосборах. Одним из методов, который я хочу применить для этого, является канонический корреляционный анализ (CCA) между физико-химическими параметрами и свойствами эдафоклимата c, соответствующими каждому водоразделу. Во-первых, мне нужно обнаружить возможную мультиколлинеарность в каждом наборе переменных, но я не знаю, как действовать, потому что мои независимые переменные являются категориями / номиналами (использование почвы в сельском хозяйстве, использование почвы в естественных лесах и смешанное использование почвы) и наиболее распространенный метод Решением этой проблемы является построение модели линейной регрессии (для которой нужны числовые предикторы). Я обнаружил, что кодирование моих IV как фиктивных переменных может работать, но я не эксперт по статистике, поэтому я немного озадачен тем, как действовать, потому что эти IV являются чисто качественными. Также найдено 8 способов обнаружения мультиколлинеарности , что существуют различные индикаторы, которые могут помочь нам обнаружить мультиколлинеарность, но так как это не краткие ответы, я не уверен в том, что я получаю при этом. Я надеюсь применить тест VIF к каждому набору, но я не знаю, как сделать фиктивные коды моих категорий IV. Кто-нибудь может подсказать, как обнаружить мультиколлинеарность в матрице с номинальными значениями IV и числовыми DV?
Это одна из матриц, над которой я работаю, чтобы вы могли ее попробовать. Здесь вы можете скачать оба набора, которые я использую на этом Спасибо !!
> str(Y)
'data.frame': 17 obs. of 26 variables:
$ Cuenca : Factor w/ 8 levels "Agricola_ULM",..: 3 3 3 5 5 5 7 7 7 2 ...
$ Altitud : int 137 165 195 678 724 1015 392 491 508 4 ...
$ Pendiente: num 4.86 6.26 3.73 4.86 14.34 ...
$ Arena : num 33 33 33 63.4 63.4 ...
$ Limo : num 39 39 39 27.4 27.4 ...
$ Arcilla : num 28 28 28 9.2 9.2 ...
$ Prof : int 75 75 75 100 100 100 115 115 115 80 ...
$ DA : num 0.7 0.7 0.7 0.84 0.84 0.84 0.7 0.7 0.7 0.7 ...
$ AgDisp : num 12.86 12.86 12.86 7.23 7.23 ...
$ CO_1 : num 10.52 10.52 10.52 5.01 5.01 ...
$ CO_2 : num 7.35 6.38 5.98 5.53 5.11 7.29 6.05 4.89 4.63 6.58 ...
$ MO : num 18.13 18.13 18.13 8.63 8.63 ...
$ pH : num 5.78 5.78 5.78 6.03 6.03 6.03 5.5 5.5 5.5 5.88 ...
$ Nt : num 0.91 0.91 0.91 2.75 2.75 2.75 0.77 0.77 0.77 0.37 ...
$ Pap : num 6.33 6.33 6.33 13 13 ...
$ Pret : num 75.6 75.6 75.6 98 98 ...
$ Poros : int 75 75 75 50 50 50 50 50 50 50 ...
$ CIC : num 50 50 50 19.7 19.7 ...
$ Taire_o : num 13.2 12.9 12.9 10.8 10.4 ...
$ Taire_i : num 8.3 8 8 5.8 5.45 4.5 6.9 6.5 6.35 9 ...
$ Taire_p : num 7.35 7.1 7.05 5.1 4.75 3.95 6.05 5.75 5.6 7.8 ...
$ Taire_v : num 10.25 10 10 8.05 7.65 ...
$ PP_o : num 78.3 78.8 79.5 109.2 111.2 ...
$ PP_i : num 265 270 274 341 344 ...
$ PP_p : num 222 226 228 300 304 ...
$ PP_v : num 122 124 126 145 142 ...
head(Y)
Cuenca Altitud Pendiente Arena Limo Arcilla Prof DA AgDisp CO_1 CO_2 MO pH Nt Pap Pret Poros CIC Taire_o Taire_i Taire_p Taire_v PP_o PP_i PP_p PP_v
Agricola_VCL 137 4.86 33.00 39.0 28.0 75 0.70 12.86 10.52 7.35 18.13 5.78 0.91 6.33 75.61 75 50.00 13.15 8.30 7.35 10.25 78.35 265.20 221.85 122.20
Agricola_VCL 165 6.26 33.00 39.0 28.0 75 0.70 12.86 10.52 6.38 18.13 5.78 0.91 6.33 75.61 75 50.00 12.90 8.00 7.10 10.00 78.75 270.25 226.00 124.25
Agricola_VCL 195 3.73 33.00 39.0 28.0 75 0.70 12.86 10.52 5.98 18.13 5.78 0.91 6.33 75.61 75 50.00 12.90 8.00 7.05 10.00 79.50 273.50 228.50 126.50
Coigue_LNV 678 4.86 63.43 27.4 9.2 100 0.84 7.23 5.01 5.53 8.63 6.03 2.75 13.00 98.00 50 19.73 10.85 5.80 5.10 8.05 109.15 341.15 300.15 144.65
Coigue_LNV 724 14.34 63.43 27.4 9.2 100 0.84 7.23 5.01 5.11 8.63 6.03 2.75 13.00 98.00 50 19.73 10.45 5.45 4.75 7.65 111.25 343.75 304.50 142.50
Coigue_LNV 1015 5.07 63.43 27.4 9.2 100 0.84 7.23 5.01 7.29 8.63 6.03 2.75 13.00 98.00 50 19.73 9.50 4.50 3.95 6.70 109.20 328.50 296.00 130.65