Что бы это значило, когда переменная сильно коррелирует с перехватом в логистике процессов в SAS? - PullRequest
1 голос
/ 07 июня 2011

Я обнаружил в одном из моих отчетов по логистике, что определенная переменная сильно коррелирует с перехватом.Как я могу интерпретировать это?Что я должен изменить, чтобы изменить это соотношение?

РЕДАКТИРОВАТЬ: попробуйте задать этот вопрос с более теоретической точки зрения.В результатах анализа оценки корреляции из большинства пакетов логистической регрессии, что это значит, если вы видите, что оценка перехвата сильно коррелирует с определенной переменной?Как бы вы справились с такой ситуацией?Надеюсь, это более понятный способ задать вопрос.Большое спасибо всем.

1 Ответ

5 голосов
/ 09 июня 2011

Положительная корреляция между коэффициентом пересечения и ковариации означает, что большая часть ваших ковариатных значений отрицательна (или наоборот: отрицательная корреляция будет видна с положительными значениями).

Это не ограничивается логистической регрессией и может быть легче увидеть с помощью линейной регрессии. Подумайте о графике рассеяния ваших значений как окаймление справа от оси y и нарисуйте наиболее подходящую линию линейной регрессии. Теперь немного увеличьте и его y-перехват, и наклон: если «пятно» достаточно далеко, линия полностью пропустит его. Таким образом, вы не можете перемещать оба параметра в одном направлении, получая при этом достаточно подходящую линию. Другими словами, оценки имеют отрицательную корреляцию.

На практике это не имеет большого значения. Это правда, что оценка перехвата будет иметь высокую изменчивость, но это не удивительно, если объем ваших данных отличается от 0. Часто x = 0 не имеет смысла, поэтому вы даже не заботитесь о перехвате. Если вы просто не можете видеть эти большие корреляции, просто отцентрируйте свою переменную x. Ось Y переместится в середину ваших данных, и корреляция волшебным образом исчезнет. Конечно, значение перехвата также меняется, но это часто желательно.

...