CCA показывает только первые 4 переменные - PullRequest
0 голосов
/ 18 июня 2020

Newi sh to R, но может ли кто-нибудь помочь мне понять, почему мой CCA показывает только первые 4 переменные среды ??

Это проблема значимости или проблема кода?

У меня есть расположение видов в Animal_matrix, а затем мне нужны все переменные среды в графике. Я также пробовал: Animal_matrix ~ T_height., Data = VegData1

Это работало, когда у меня было 20 сайтов (которые представлены в виде строк? - поправьте меня, если я ошибаюсь), тогда я сжал данные до 5 «сайты».

Call:
cca(formula = Animal_matrix ~ T_Height + T_Stem + T_DBH + G_Alive + G_Dead + ST_Alive + ST_Dead + L_Alive + L_Dead + T_Alive +      T_Dead + SB_Alive + SB_Dead, data = VegData1) 

Partitioning of scaled Chi-square:
              Inertia Proportion
Total          0.5967          1
Constrained    0.5967          1
Unconstrained  0.0000          0

Eigenvalues, and their contribution to the scaled Chi-square 

Importance of components:
                        CCA1   CCA2    CCA3    CCA4
Eigenvalue            0.3468 0.1419 0.06997 0.03802
Proportion Explained  0.5813 0.2378 0.11726 0.06371
Cumulative Proportion 0.5813 0.8190 0.93629 1.00000

Accumulated constrained eigenvalues
Importance of components:
                        CCA1   CCA2    CCA3    CCA4
Eigenvalue            0.3468 0.1419 0.06997 0.03802
Proportion Explained  0.5813 0.2378 0.11726 0.06371
Cumulative Proportion 0.5813 0.8190 0.93629 1.00000

Scaling 2 for species and site scores
* Species are scaled proportional to eigenvalues
* Sites are unscaled: weighted dispersion equal on all dimensions


Species scores

                             CCA1      CCA2      CCA3      CCA4
Australian Hobby          -1.3828  0.675743  1.996326 -1.206407
Australian Owlet-nightjar  0.9656  0.554703  0.093529  0.187641
....

Site scores (weighted averages of species scores)

        CCA1    CCA2     CCA3    CCA4
row1 -1.3828  0.6757  1.99633 -1.2064
row2 -1.0709 -0.6939  0.26238  2.1019
row3 -0.8794  0.2160 -1.57925 -0.6554
row4  0.7206 -2.7502  0.29279 -1.0531
row5  0.9656  0.5547  0.09353  0.1876


Site constraints (linear combinations of constraining variables)

        CCA1    CCA2     CCA3    CCA4
row1 -1.3828  0.6757  1.99633 -1.2064
row2 -1.0709 -0.6939  0.26238  2.1019
row3 -0.8794  0.2160 -1.57925 -0.6554
row4  0.7206 -2.7502  0.29279 -1.0531
row5  0.9656  0.5547  0.09353  0.1876


Biplot scores for constraining variables

            CCA1    CCA2     CCA3    CCA4
T_Height -0.5567 -0.5619 -0.58734 -0.1714
T_Stem   -0.9023 -0.3507 -0.24253 -0.0640
T_DBH    -0.5926 -0.5503 -0.52225 -0.2708
G_Alive  -0.8090 -0.2172  0.06109  0.5428

1 Ответ

1 голос
/ 18 июня 2020

Похоже, что вы создали множество фиктивных переменных для живых существ. Я подозреваю, что они в значительной степени коллинеарны до степени избыточности; у вас нет n уникальных переменных, только 4.

Поскольку такие данные и ранг недостаточны, мы не можем хранить их в моделях и выполнять с ними линейную алгебру, поэтому они получают удалены или с псевдонимом.

Вы не должны вручную создавать фиктивные переменные для функции моделирования R (в общем). Вместо этого имейте переменные, которые являются факторами с требуемыми уровнями, скажем, G с уровнями Alive и Dead, и тогда R разработает фиктивную переменную для вас. Тем не менее, вы все равно не сможете включить все эти живые / мертвые переменные в модель, если они не добавят ничего нового, как только вы узнаете одну из них.

...