Корреляция между независимыми объясняющими переменными в регрессии - PullRequest
0 голосов
/ 07 января 2019
sample_size = 100
x1 = rnorm(sample_size, mean = 0, sd = 0.5)
x2 = rnorm(sample_size, mean = 0, sd = 0.5)
x3 = 0.5*x2+rnorm(sample_size, mean = 0, sd = 0.5)

генерировать ошибки:

epsilon = rnorm(sample_size, mean = 0, sd = 0.1)

генерирует зависимую переменную:

y = 0+0.1*x1+0.2*x2+0.3*x3+epsilon

Случай 1: x1 и x2 являются независимыми переменными. корреляция должна прийти к 0, поскольку мы увеличиваем размер выборки, т.е. кор (x1, x2)

Случай 2: Но, увидев уравнение в терминах x2,

x2=(5*y-0.5*x1-1.5*x3)

сказано, что бета должна быть -0,5
'корреляция = бета * var (x) / var (y)' корреляция = -0,5 * вар (х1) / вар (х2) в котором говорится, что корреляция не должна быть нулевой.

Где я ошибаюсь во втором случае ???

...