Просто добавьте к тому, что Дирк сказал о методе Number of Condition, эмпирическое правило заключается в том, что значения CN > 30 indicate severe collinearity
. Другие методы, кроме номера условия, включают:
1) определитель ковариации
матрица, которая колеблется от 0 (идеально
Коллинеарность) до 1 (без коллинеарности)
# using Dirk's example
> det(cov(mm12[,-1]))
[1] 0.8856818
> det(cov(mm123[,-1]))
[1] 8.916092e-09
2) Использование факта, что определитель диагональной матрицы является произведением собственных значений => Наличие одного или нескольких небольших собственных значений указывает на коллинеарность
> eigen(cov(mm12[,-1]))$values
[1] 1.0876357 0.8143184
> eigen(cov(mm123[,-1]))$values
[1] 5.388022e+00 9.862794e-01 1.677819e-09
3) Значение фактора инфляции дисперсии (VIF). VIF для предиктора i равен 1 / (1-R_i ^ 2), где R_i ^ 2 - это R ^ 2 из регрессии предиктора i против оставшихся предикторов. Коллинеарность присутствует, когда VIF по меньшей мере для одной независимой переменной велик. Правило большого пальца: VIF > 10 is of concern
. Для реализации в R см. здесь . Я также хотел бы прокомментировать, что использование R ^ 2 для определения коллинеарности должно идти рука об руку с визуальным исследованием диаграмм рассеяния, поскольку один выброс может «вызвать» коллинеарность там, где его нет, или скрыть коллинеарность там, где он существует ,