R - множественная линейная регрессия, генерирующая дополнительную переменную с определенным коэффициентом регрессии - PullRequest
0 голосов
/ 06 июня 2018

Я хочу выполнить анализ смоделированной мощности для набора данных, который у меня есть.Давайте предположим, что набор данных имеет четыре переменные (имена столбцов набора данных):

Y - это зависимая переменная, непрерывная и нормально распределенная.

X1 - независимая переменная, непрерывная иимеет нормальное распределение.

X2 - независимая переменная, является непрерывной и НЕ распределяется нормально.

X3 - независимая переменная, является непрерывной и НЕ распределяется нормально.

Теперь эти данные состоят из 5000 строк, поэтому существует 5000 записей.

Я выполнил линейную регрессию, используя следующую формулу:

summary(lm( Y ~ X1 + X2 + X3)), и определил коэффициенты регрессии X1, X2 и X3, чтобы они были B1, B2 и B3 соответственно.

Теперь у меня есть пятая переменная (x4), к которой у меня нет доступа, но я считаю, что она нормально распределена.Теперь линейная модель может быть обновлена ​​по следующей формуле:

lm(Y ~ X1 + X2 + X3 + X4), с коэффициентом регрессии B4.

Я не знаю, что такое B4, но у меня есть несколько сценариев, где B4 находится между 0,2 - 0,5.

Я хочу запустить симуляции Монте-Карло, чтобы проверить, какой размер выборки необходим для достижения 80% мощности на различных B4.Для этого мне нужно сгенерировать нормально распределенную переменную, которая может имитировать х4 и имеет коэффициент регрессии B4.Есть ли способ сгенерировать это в R?

...