Как проверить мультиколлинеарность в наборе с категориальными независимыми переменными и несколькими числовыми зависимыми переменными? - PullRequest
0 голосов
/ 05 апреля 2020

Я изучаю влияние использования почвы / растительного покрова на несколько физико-химических параметров воды в 6 различных водосборах. Одним из методов, который я хочу применить для этого, является канонический корреляционный анализ (CCA) между физико-химическими параметрами и свойствами эдафоклимата c, соответствующими каждому водоразделу. Во-первых, мне нужно обнаружить возможную мультиколлинеарность в каждом наборе переменных, но я не знаю, как действовать, потому что мои независимые переменные являются категориями / номиналами (использование почвы в сельском хозяйстве, использование почвы в естественных лесах и смешанное использование почвы) и наиболее распространенный метод Решением этой проблемы является построение модели линейной регрессии (для которой нужны числовые предикторы). Я обнаружил, что кодирование моих IV как фиктивных переменных может работать, но я не эксперт по статистике, поэтому я немного озадачен тем, как действовать, потому что эти IV являются чисто качественными. Также найдено 8 способов обнаружения мультиколлинеарности , что существуют различные индикаторы, которые могут помочь нам обнаружить мультиколлинеарность, но так как это не краткие ответы, я не уверен в том, что я получаю при этом. Я надеюсь применить тест VIF к каждому набору, но я не знаю, как сделать фиктивные коды моих категорий IV. Кто-нибудь может подсказать, как обнаружить мультиколлинеарность в матрице с номинальными значениями IV и числовыми DV?

Это одна из матриц, над которой я работаю, чтобы вы могли ее попробовать. Здесь вы можете скачать оба набора, которые я использую на этом Спасибо !!

> str(Y)
'data.frame':   17 obs. of  26 variables:
 $ Cuenca   : Factor w/ 8 levels "Agricola_ULM",..: 3 3 3 5 5 5 7 7 7 2 ...
 $ Altitud  : int  137 165 195 678 724 1015 392 491 508 4 ...
 $ Pendiente: num  4.86 6.26 3.73 4.86 14.34 ...
 $ Arena    : num  33 33 33 63.4 63.4 ...
 $ Limo     : num  39 39 39 27.4 27.4 ...
 $ Arcilla  : num  28 28 28 9.2 9.2 ...
 $ Prof     : int  75 75 75 100 100 100 115 115 115 80 ...
 $ DA       : num  0.7 0.7 0.7 0.84 0.84 0.84 0.7 0.7 0.7 0.7 ...
 $ AgDisp   : num  12.86 12.86 12.86 7.23 7.23 ...
 $ CO_1     : num  10.52 10.52 10.52 5.01 5.01 ...
 $ CO_2     : num  7.35 6.38 5.98 5.53 5.11 7.29 6.05 4.89 4.63 6.58 ...
 $ MO       : num  18.13 18.13 18.13 8.63 8.63 ...
 $ pH       : num  5.78 5.78 5.78 6.03 6.03 6.03 5.5 5.5 5.5 5.88 ...
 $ Nt       : num  0.91 0.91 0.91 2.75 2.75 2.75 0.77 0.77 0.77 0.37 ...
 $ Pap      : num  6.33 6.33 6.33 13 13 ...
 $ Pret     : num  75.6 75.6 75.6 98 98 ...
 $ Poros    : int  75 75 75 50 50 50 50 50 50 50 ...
 $ CIC      : num  50 50 50 19.7 19.7 ...
 $ Taire_o  : num  13.2 12.9 12.9 10.8 10.4 ...
 $ Taire_i  : num  8.3 8 8 5.8 5.45 4.5 6.9 6.5 6.35 9 ...
 $ Taire_p  : num  7.35 7.1 7.05 5.1 4.75 3.95 6.05 5.75 5.6 7.8 ...
 $ Taire_v  : num  10.25 10 10 8.05 7.65 ...
 $ PP_o     : num  78.3 78.8 79.5 109.2 111.2 ...
 $ PP_i     : num  265 270 274 341 344 ...
 $ PP_p     : num  222 226 228 300 304 ...
 $ PP_v     : num  122 124 126 145 142 ...
head(Y)
Cuenca Altitud Pendiente Arena Limo Arcilla Prof DA AgDisp CO_1 CO_2 MO pH Nt Pap Pret Poros CIC Taire_o Taire_i Taire_p Taire_v PP_o PP_i PP_p PP_v
Agricola_VCL 137 4.86 33.00 39.0 28.0 75 0.70 12.86 10.52 7.35 18.13 5.78 0.91 6.33 75.61 75 50.00 13.15 8.30 7.35 10.25 78.35 265.20 221.85 122.20
Agricola_VCL 165 6.26 33.00 39.0 28.0 75 0.70 12.86 10.52 6.38 18.13 5.78 0.91 6.33 75.61 75 50.00 12.90 8.00 7.10 10.00 78.75 270.25 226.00 124.25
Agricola_VCL 195 3.73 33.00 39.0 28.0 75 0.70 12.86 10.52 5.98 18.13 5.78 0.91 6.33 75.61 75 50.00 12.90 8.00 7.05 10.00 79.50 273.50 228.50 126.50
Coigue_LNV 678 4.86 63.43 27.4 9.2 100 0.84 7.23 5.01 5.53 8.63 6.03 2.75 13.00 98.00 50 19.73 10.85 5.80 5.10 8.05 109.15 341.15 300.15 144.65
Coigue_LNV 724 14.34 63.43 27.4 9.2 100 0.84 7.23 5.01 5.11 8.63 6.03 2.75 13.00 98.00 50 19.73 10.45 5.45 4.75 7.65 111.25 343.75 304.50 142.50
Coigue_LNV 1015 5.07 63.43 27.4 9.2 100 0.84 7.23 5.01 7.29 8.63 6.03 2.75 13.00 98.00 50 19.73 9.50 4.50 3.95 6.70 109.20 328.50 296.00 130.65
...