Вы правильно читаете значения, они просто означают разные вещи. PROC CORR дает вам корреляцию переменных, в то время как CORRB - это корреляцию коэффициентов этих переменных в модели.
Вот интуитивное объяснение того, почему положительно коррелированные предикторы будут иметь отрицательно коррелированные коэффициенты. Предположим, y = a + b1*x1 + b2*x2 + eps
. Если вы немного увеличите b1
по сравнению со своим лучшим значением, полученным из регрессии, то предсказанное значение для y
также увеличится (для положительного значения x1
) и ухудшит общее соответствие. Один из способов компенсировать это и переместить прогнозные значения ближе к наблюдаемым - это уменьшить b2
: поскольку высокие значения x1
связаны с высокими значениями x2
, вы получите обратно близко к оригинальной посадке. Это показывает, что неопределенность в b2
отрицательно коррелирует с неопределенностью в b1
: увеличение одного при уменьшении другого приведет к аналогичным подгонкам.
Может быть поучительно взглянуть на крайний случай идеальной корреляции: x2=x1
. Тогда следующее даст вам точно такие же прогнозы:
y = 1 + 2*x + 3*x
y = 1 + 3*x + 2*x
y = 1 + 9*x + (-4)*x
etc
Так b2 = 5-b1
и коэффициенты имеют идеальную отрицательную корреляцию.