NA против вычислительной сингулярной ошибки в R множественной регрессии (glm) - PullRequest
0 голосов
/ 14 февраля 2020

Иногда, когда я использую glm для построения модели множественной регрессии, он возвращает модель с коэффициентами для всех, кроме одной (или небольшого подмножества) переменных, которые перечислены как NA. Предположительно, NA связаны с тем, что эти переменные являются ковариатами некоторых других переменных или их линейных комбинаций.

В других случаях я просто получаю

Error in solve.default(hessian, gradient, tol = <some number << 1 >), 
system is computationally singular: 
reciprocal conditiona number = < some number <<1 >

Предположительно, эта ошибка сингулярности является результатом То же самое, что дает мне значения NA для других моделей (колинеарность).

Мой вопрос заключается в том, почему R может генерировать модель путем «выделения» проблемных переменных в некоторых случаях (как NA), тогда как в других случаях Коллинеарные переменные просто дают ошибку особенности.

В тех случаях, когда R просто возвращает ошибку сингулярности, существует ли простой способ определить, какие переменные являются причиной ошибки, кроме утомительного пошагового сложения?

...