sample_size = 100
x1 = rnorm(sample_size, mean = 0, sd = 0.5)
x2 = rnorm(sample_size, mean = 0, sd = 0.5)
x3 = 0.5*x2+rnorm(sample_size, mean = 0, sd = 0.5)
генерировать ошибки:
epsilon = rnorm(sample_size, mean = 0, sd = 0.1)
генерирует зависимую переменную:
y = 0+0.1*x1+0.2*x2+0.3*x3+epsilon
Случай 1: x1 и x2 являются независимыми переменными.
корреляция должна прийти к 0, поскольку мы увеличиваем размер выборки, т.е. кор (x1, x2)
Случай 2: Но, увидев уравнение в терминах x2,
x2=(5*y-0.5*x1-1.5*x3)
сказано, что бета должна быть -0,5
'корреляция = бета * var (x) / var (y)'
корреляция = -0,5 * вар (х1) / вар (х2)
в котором говорится, что корреляция не должна быть нулевой.
Где я ошибаюсь во втором случае ???